Repository 'mitohifi'
hg clone https://toolshed.g2.bx.psu.edu/repos/bgruening/mitohifi

Changeset 0:f6065bc6e428 (2021-05-29)
Next changeset 1:99ddbf037d98 (2023-05-03)
Commit message:
"planemo upload for repository https://github.com/bgruening/galaxytools/tree/master/tools/mitohifi commit fb6bc2755715fee453208273dd26b69da97ca65c"
added:
macros.xml
mitohifi.xml
test-data/assembly.fa
test-data/pacbio_01.fasta.gz
test-data/pacbio_02.fasta.gz
test-data/related_mitogenome.fasta
test-data/related_mitogenome.gb
test-data/related_mitogenome_assembly.fasta
test-data/related_mitogenome_assembly.gb
b
diff -r 000000000000 -r f6065bc6e428 macros.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/macros.xml Sat May 29 12:50:32 2021 +0000
b
@@ -0,0 +1,22 @@
+<macros>
+    <token name="@TOOL_VERSION@">2</token>
+    <token name="@GALAXY_TOOL_VERSION@">galaxy0</token>
+    <xml name="edam_ontology">
+        <edam_topics>                                                                                  
+            <edam_topic>topic_0196</edam_topic>
+        </edam_topics>
+        <edam_operations>
+            <edam_operation>operation_0525</edam_operation>
+        </edam_operations>
+    </xml>
+    <xml name="requirements">
+        <requirements>
+            <container type="docker">quay.io/bgruening/mitohifi:2_galaxy0</container>
+        </requirements>
+    </xml>
+    <xml name="citations">
+        <citations>
+            <citation type="doi">10.1111/1755-0998.13160</citation>
+        </citations>
+    </xml>
+</macros>
b
diff -r 000000000000 -r f6065bc6e428 mitohifi.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/mitohifi.xml Sat May 29 12:50:32 2021 +0000
[
b'@@ -0,0 +1,648 @@\n+<tool id=\'mitohifi\' name=\'MitoHiFi\' version=\'@TOOL_VERSION@+@GALAXY_TOOL_VERSION@\' profile=\'20.01\'>\n+    <description>assembly mitogenomes from Pacbio HiFi reads</description>\n+    <macros>\n+        <import>macros.xml</import>\n+    </macros>\n+    <expand macro=\'edam_ontology\' />\n+    <expand macro=\'requirements\' />\n+    <command detect_errors=\'exit_code\'><![CDATA[\n+        #if $operation_mode.command == \'find_reference\'\n+            findMitoReference.py \n+            --species \'${operation_mode.species}\'\n+            --email \'${operation_mode.email}\'\n+            --outfolder ./ \n+            #if $operation_mode.min_length\n+                --min_length $operation_mode.min_length\n+            #end if\n+            $operation_mode.exact_specie\n+            && mv ./*fasta ./reference_genome.fasta\n+            && mv ./*gb ./reference_genome.gb\n+        #elif $operation_mode.command == \'mitohifi\'\n+            ln -s \'${operation_mode.reference_genbank}\' related_mito.gb\n+            && ln -s \'${operation_mode.reference_fasta}\' related_mito.fasta\n+\n+            && mitohifi_v2.py \n+            #if $operation_mode.input_option.input == \'pacbio\'\n+                -r \'${ \' \'.join(["%s" % $x for $x in $operation_mode.input_option.input_reads]) }\'\n+                -m $operation_mode.input_option.bloom_filter\n+            #else\n+                -c \'${operation_mode.input_option.input_assembly}\'\n+            #end if\n+            -f related_mito.fasta\n+            -g related_mito.gb\n+            #if $operation_mode.advanced_options.query_blast\n+                -p $operation_mode.advanced_options.query_blast\n+            #end if\n+            #if $operation_mode.advanced_options.circular_size\n+                --circular-size $operation_mode.advanced_options.circular_size\n+            #end if\n+            #if $operation_mode.advanced_options.circular_offset\n+                --circular-offset $operation_mode.advanced_options.circular_offset\n+            #end if\n+            -o $operation_mode.genetic_code\n+            -t \\${GALAXY_SLOTS:-1}\n+            #if $operation_mode.output_zip\n+                && zip -r output.zip contigs_* final_mitogenome* reads_mapping_and_assembly/\n+            #end if\n+        #end if\n+    ]]>    </command>\n+    <inputs>\n+        <conditional name="operation_mode">\n+            <param name="command" type="select" label="Operation type selector" help="Select a type of operation">\n+                <option value="find_reference">Find a close-related mitochondrial reference genome</option>\n+                <option value="mitohifi">Run MitoHiFi</option>\n+            </param>\n+            <when value="find_reference">\n+                <param argument="--species" type="text" value="" label="Specie name" help="Specie name in binomial nomenclature">\n+                    <sanitizer invalid_char="">\n+                        <valid initial="string.letters,string.digits">\n+                            <add value=" "/>\n+                        </valid>\n+                    </sanitizer>\n+                </param>\n+                <param argument="--email" type="text" value="" label="Email" help="Required for NCBI database query">\n+                    <sanitizer invalid_char="">\n+                        <valid initial="string.letters,string.digits">\n+                            <add value="@"/>\n+                            <add value="."/>\n+                            <add value="_"/>\n+                            <add value=" "/>                        \n+                        </valid>\n+                    </sanitizer>\n+                </param>\n+                <param argument="--min_length" type="integer" \n+                    min="0" max="15000000" value="" optional="True" label="Minimal appropriate length" />\n+                <param name="exact_specie" argument="-s" type="boolean" \n+                    truevalue="-s" falsevalue="" checked="False" optional="True" label="Search for an exact species"/>\n+            </w'..b'        <has_size value="31407"/>\n+                    <has_line line="DEFINITION  NC_016067.1_rc_rotated"/>\n+                </assert_contents>\n+            </output>\n+        </test>\n+        <!--Test 10-->\n+        <test expect_num_outputs="6">\n+            <conditional name="operation_mode">\n+                <param name="command" value="mitohifi"/>\n+                <conditional name="input_option">\n+                    <param name="input" value="pacbio"/>\n+                    <param name="input_reads" value="pacbio_01.fasta.gz,pacbio_02.fasta.gz"/>\n+                </conditional>\n+                <param name="reference_fasta" value="related_mitogenome.fasta"/>\n+                <param name="reference_genbank" value="related_mitogenome.gb"/>\n+                <param name="genetic_code" value="5"/>\n+                <param name="output_zip" value="True"/>\n+            </conditional>\n+            <output name="mitogenome_fasta" ftype="fasta">\n+                <assert_contents>\n+                    <has_size value="15337"/>\n+                    <has_line line=">ptg000001c_rotated"/>\n+                </assert_contents>\n+            </output>\n+            <output name="mitogenome_genbank" ftype="genbank">\n+                <assert_contents>\n+                    <has_size value="30637"/>\n+                    <has_line line="DEFINITION  ptg000001c_rotated"/>\n+                </assert_contents>\n+            </output>\n+            <output name="hifiasm" ftype="fasta">\n+                <assert_contents>\n+                    <has_size value="4123737"/>\n+                    <has_line line=">m64094_200908_163909/67999/ccs"/>\n+                </assert_contents>\n+            </output>\n+            <output name="hifiasm_filtered" ftype="fasta">\n+                <assert_contents>\n+                    <has_size value="4191948"/>\n+                    <has_line line=">m64094_200908_163909/1605/ccs"/>\n+                </assert_contents>\n+            </output>\n+            <output name="hifiasm_contigs" ftype="fasta">\n+                <assert_contents>\n+                    <has_size value="15329"/>\n+                    <has_line line=">ptg000001c"/>\n+                </assert_contents>\n+            </output>\n+            <output name="zip_file" ftype="zip">\n+                <assert_contents>\n+                    <has_size value="5418006" delta="100"/>\n+                </assert_contents>\n+            </output>\n+        </test>\n+    </tests>\n+    <help><![CDATA[\n+.. class:: infomark\n+\n+**Purpose**\n+\n+\n+The dissemination of high-quality long reads (such as PacBio HiFi) makes the assembly of high-quality mitogenome straight forward. Because of the circular nature of the molecule, however, the mitocontig is usually assembled redundantly resulting in multiple-copy mitogenome-contigs. This pipeline was developed to finalise the assembly and annotation of the mitogenome. It will also dected different variants of the mitogenome present in your sample. At the end you are going to have all the variants assembled and annotated, and MitoHiFi.v2 is going to choose a final consensus sequence. In addtion, you will find an aligment of all the variants to facilitate your analysis of mitochondria heteroplasmy.\n+\n+.. class:: infomark\n+\n+**Important parameter to change and test (-p)**\n+\n+Mitohifi is going to pull possible mito contigs by blasting your contigs with the close-related mito. The Default parameter -p is going to chose any contig which has 50% or more of its length in the blast match. This is the default because with invertebrate taxa from the Darwin Tree of Life we have been seeing that the repetitive portion of the mitogenomes is not very conserved between some taxa. In these cases, a more stringent -p ends up excluding real mito sequences. Nevertheless, if you are working with more conserved taxa - such as mammals and other vertebrates - use higher -p (such as 80 or 90) for better results.\n+\n+\n+    ]]>    </help>\n+    <expand macro="citations" />\n+</tool>\n'
b
diff -r 000000000000 -r f6065bc6e428 test-data/assembly.fa
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/assembly.fa Sat May 29 12:50:32 2021 +0000
b
b'@@ -0,0 +1,17191 @@\n+>tig00000044_1\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTACCTA\n+ACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACTAACCTAA\n+CCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAA\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+ACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTA\n+ACCTAACCCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCAACCTAACCTAACCTAACCTAACTAACCTAA\n+CCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTA\n+ACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTA\n+ACCTAACCTAACCTAACCTAACTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAA\n+CCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTACCTAACCTAACCTAACCTAAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACC\n+TAACCTACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACTTAACCTAACCTAACCTAACCTAACCTAACACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACC\n+TAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACC\n+TAACCTAACCTAACCTAACCTAACCTAACCTAAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACTAACCTAACCTAACCT\n+AACCTAACCTAACCTACCTAACCTAACCTAACTAACCTAACCTAACCTAACCTAACCTAA\n+CCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAA\n+CCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAC\n+CTAACCTAACCTAACCTAAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAA\n+CCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAA\n+CCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACAACCTAACC\n+TAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCAAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTACCTAACCTAACCTAACCTAACCTA\n+ACCTAACCTAACCTAACCTAACTACCTAACCTAACCTAACTAACCTAACCTAACCTAACC\n+TAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACC\n+TAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACC\n+TAACCTAACCTAACCTAACCTAACTAACCTAACCTAACCTACCTAACCTAACCTAACCTA\n+ACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCTAACCT\n+AACCTAACCTAACCTAACCTAACCTACCTAACCTAACCTAACCTAACCTAACCTAA'..b'ACCTGTGGTATATAGTCAATTCTCATTACA\n+AAGACATTGAAGTTGTGATTCGCTTTTAATTAAAATAACTTGTGAGTTATCATCTTTCCT\n+TAAGTAAACTCGGCCATACGCAGTCCAACAATATTTGTATCTCTTGGTTTTCACTAGATT\n+ACGTGCTAGAAAATGTAGTCGAGCAGCTTTTGCTGTAAGTTGTTCTGCTACGAATATAGG\n+TGTATACTCCAATGATTTGAAGCCCAAGTGTTTGGCACATAGTTTATTTTTCTGTTGAAT\n+ATTAAATGACTTACTTGCTTTCATAATTTTATTTTTCAGTATGGTTGAGGATGTCTCGAC\n+GACGATCGGAGTGTTTGTGACATTTTCTTTCTTCCCACGAACTGTGTAGATATCTTTAAT\n+ATCAGTGTTTTGTATTTGACAACCTACTGTATCGGTCAAACATAAAACCATATTCACAAG\n+GTCGTCCTTAGTTTCATCGAACTTTTTAGGCACATTTTTTATTTCAAAGTTGGTTTTCCG\n+ACTGTCCTGCTGCATATTTTCTATTTTGTCTTCCAGTAAAGTGATGTATTTTCTATCTTC\n+ATTAATTTTTCCTTCAAGAGAATCAATTTTTTTCTTGAATTCTTCATTTTGAGCAGATAA\n+AAATGCGATCGAGTTTTCGATATTGATGTTTGTTTGTTGTATTTCTTTAAGGGTGTCTGC\n+ATTTTTTTTTAAATTCTTTCTCTTGGGATTTCATTAACGAGGAAAACATGTTCTTCATTT\n+CATTTCTTAACTGAAACATATCAAAAGTCGCTTGGTCTACTTGTTTCTTTTTTGGGCGTG\n+AAGTAATGTAGTTCGGCGGCGTTGATATTCCTACGCAATCTCCTTCCGTATCCGAATGAG\n+ACATGTCCATCCAATATCACTTTGACAGTCTTTATAGGTATCCAGGTAGATAGGTAGTAT\n+ATCAATAATTACCCTTGTCAAATGTATTATGGAGTTATAAAAAATAAAATATGGATTAAA\n+TGCGTACCGATGATTTGTTGCGTAATCGAGTGTCCGTCGCCTTGGTAAGTACTTGTAGTC\n+TTGCACGTGCCAAACGCGAGGGAGAGCGGTCCGTGAGGGGTCCGGGAGCGGCGGCAAATG\n+CACAGGTGTCCGGGCGCCTGCGGGTGGAGGTGCGGCCGTCGGGAGCGGAGGAAATTTTTA\n+TTTACAAATTTAAATTATAAATTATTTTTGTAGTGCACTTCGCTTTGAGTCTAAATAACG\n+TGTATTAGGGTTCATTTTTTTTTACTAGTATTTTGAATATTTTTTATCAGCCGCGTACAC\n+GTCCTTACTGGACAGACGCACAGAGCGAAGGGGATACTGAAGAGAATGTTTTAAGATCTA\n+CACGATTAAGTCTGGGGAGGAAAATAACATATATGTAGCTTTGAGAAGCAGATATTGGTT\n+TGGAAATTCCCACTCAGCAAAGTTCAGAAGTCTTAGAAGTTGTCACTATTTTACCAGTAT\n+TATTAAAATCTTATTTTGCCACGAGTAAAAGAATAGAAGGTTATATAATACATATTGCTA\n+AAGAAATTATAGTAACCCGTTTGATCGTAGATAAGAATTTATTCAAAAGATCCGGATGCT\n+ATGGTCAAAAAACCTAGGGAATTGTAGTTTCACTGACATGAAAATCCTCCGCGGAGGTCT\n+CCGTCTATACCGCAGAAGACCTTTGGGATCTCAAAAATAATTCTTTACATCATTTAACGA\n+ATTCTACACAGCGTTTTACTAATTAATACTAATTCTGGTTACTTTAACATAGAACAATTT\n+TTATAGGTAACATGTGAAAACATAGATTATTAAATTCTTTTTCATTCCTCACACCTGCTA\n+TTTTTCTTGACAATGGCTGCTATAACCTCAATCATACTTGATATGAAATCGCATATCGTT\n+CAGATATCATCGTTTAGCAGAACAATCATAATTCATTTTTCACTTGAATAGCAAGTATGC\n+TTCACATCACTGAATTAGCGTGTTGTGAATCTCATCGCAACGAAATGACAGTTACAAAAT\n+GAGTTTTTAGTGTATAACTAGTATATGTCGCCATTTATATACCAATCTGTGATATACACG\n+GGCGCAAGCCATTTGTTTCGTCTGTTCACGAAACTACTTCAGATGCTTAGCACGAACAGA\n+TTGACGTTAGCGTAATGTTACTGAGTTTAAACGTTACCCTTACCACACTACAAATTTACT\n+AATGGCTGCTATCAATACTTAATCCAAGGATAAATTTGCCTATTACCAGTAAAACTTTCA\n+CATATTTTATATGGATCTGTCAAAATAGTAGTGACAGTAAGAAAATCTATCATTGAATAA\n+AATATTGAAACCGGACATAAACAAACATGAGTTTGTACGTTTTCGCGATAGCGTTACGCT\n+AACGCCAATGAATTCATGCTAACCCCTATGAGGATTTATAATATCAGCCTATACTGTCTA\n+CTGGGCAGAGGCCTTTTCTCAAAAATCGAGATGAGAGAGATTAGGTCATACTCCACCACG\n+CGGACCCAGTGCGAATTGGTGGAGGCAGATTTGGTGCCACCTGCTGTTGGAACTTATCAA\n+CCCGCCTATAAGGCTTCCAACTCGGCTTAACGATTACCACATAAAGTGTTAACCGGAACC\n+AATGGCTTAACGTGCCTTCCAAAGAACGGAGACGACCCATCTCAGGCCATCCGAGTCGAA\n+TGCTGGTAACCTAAGTGATCGGTAAATACCTCAGGGTCACACAGGACTACGAGCACCTGA\n+AGGTTTAGCACGATCATATTGATGTTAGCATAGTGCTGACGAGTTGATATGCCGTCTTTT\n+ATATTAAAATTTTGCTTACTAAAGATGAACGCACAATTTAGCGAACGCAAGGTAGACAGT\n+TAACAAACTAACGGTAGACTGAAAACATCACGATAACATCAATCTGTTCAAACTAAGCCC\n+GCAATTGGAAATAAAAAGTAAAAAAATAAGTGTTTTTAGTACTTGGGAGTAAGTATCATT\n+TATATTTTTGGTTACGACTTTTGTGGATGGAAGCGTGACTTAAACTAAAAGTGTGCTGAG\n+TTTTCAAGGGATAAGTCTGCTCGTGATATGGAATGTTTTTTAAGAAACTATTTTTACTTT\n+ATCTTTGTGTCGTGTCATGTGTCATAAAGTGAAAAAGGTAGAAGTAAAAAAATACATGAG\n+TAGAAGTATAGTGACATTTCGTATGGAGAGATGGAAAGTAATCAAAATCATCAAGGATCA\n+AGATCATCAAGGTTAAGCCACGTTCGAGTCGGTAAGTCTTGAGATGGGTCACCGCTTGTA\n+GTAATTTCATAATGTCCATTTACCGGTCTGCAGAAGGCACGCTAATGCACTAGTTCCGGT\n+AACCACTAAAGCCGTTCATAACGCTTTCTAAATTGACTTAACGTCTACGTTTAAATGTGA\n+TAGTCGTTAAACCTTGATGTCTTGCCTTGAGTCGTTGCAAACTTGCCTCCATCAATCCGC\n+ACTGGGTTTGCGTGGTATAATATCATACAGACTCTCTCATAACTCCAGGGAAAGAAAATA\n+AATTACATAAATCATTTTCTTTGCCCTGGATTTATAAGAGTGGGCTTTTGCCCAGCAGTG\n+GTACAATTAAGAGAAATTTATTACCATAGAGATATACATCTCAATATTTTGCTTATATTG\n+CGATACTTGGAGTTTCTTTCACGATAAAGTAATGTTACACCGGTTATTTGAACTTAGAAA\n+TTCTTATAAATATTTGCTCCACTATCGCTAGTAAGCACATAGCTTTGTGACAATATGCCG\n+TCTCCGCTGTTACCGCAAATTGAAAGGTTTTGTGACAACTTGAAATGTATCGACGGGATA\n+TTTCGACGTTTAATGACATGTTTTGGCAGGGT\n\\ No newline at end of file\n'
b
diff -r 000000000000 -r f6065bc6e428 test-data/pacbio_01.fasta.gz
b
Binary file test-data/pacbio_01.fasta.gz has changed
b
diff -r 000000000000 -r f6065bc6e428 test-data/pacbio_02.fasta.gz
b
Binary file test-data/pacbio_02.fasta.gz has changed
b
diff -r 000000000000 -r f6065bc6e428 test-data/related_mitogenome.fasta
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/related_mitogenome.fasta Sat May 29 12:50:32 2021 +0000
b
b'@@ -0,0 +1,222 @@\n+>MW539688.1 Theretra latreillii lucasii mitochondrion, complete genome\n+TTTGATTATTTTTAGTATATAAATTAATAGAATATTTATTCTTTCTTAAGTTTTCAAAACAAATGCTTTA\n+ACAAGCTCATTAATTAATTAAAGATTAATTTATCTCAGTATTTACTTAAAATAGGGTTTAATAAGAAATA\n+ACTAAAATATAAAATTGTTAAAATTTGTCCTGTAATAACATATGGGTTTTCTACAGGTCGAGCTCCAATT\n+CAAGTTAATAAAATAATTATAATAATAAAAAATCAAAATAATAATTGATTTAATGGATAAAATTGTAATC\n+CTTGGATTTTTTTGTTGAATGTAAAAGGTAAGATAATTAAAATTAAAATTGATATGACTAAAGCAATTAC\n+TCCTCCTAATTTATTGGGAATTGATCGTAAAATTGCATAAGCAAATAAAAAATATCATTCAGGTTGAATG\n+TGAATTGGAGTTACTAATGGGTTTGCAGGAATGAAATTATCAGGGTCTCCTAATAAATATGGATTAATTA\n+AAGTTAATATAGTTAGTAAAAAAATTAAAATAATAAATCCGATTAAATCTTTGAAAGTAAAAAATGGGTG\n+AAATGGGATTTTATCTAAATTTCTGTTAATTCCTAAGGGATTGTTAGATCCAGTTTGATGAAGAAATAAT\n+AAATGAATTATAGTTAATATTAAAATAATAAATGGTAGTAGAAAATGGAAAGTATAAAAACGAGTTAATG\n+TTGCATTATCTACTGCAAATCCTCCTCAGATTCAATTTACTAATATATTTCCTAAGTATGGAATTGCTGA\n+TAATAAATTAGTAATAACTGTTGCCCCTCAAAATGATATTTGTCCTCAAGGTAATACATATCCTATAAAT\n+GCTGTTGCTATTAATATAAATAAAATAATAACTCCTACTAATCATGTATATATTAAATTAAATGATTCAT\n+AATAAATACCTCGTCCAATATGAATGTAAATACAAATAAAAAAAAATGATGCTCCATTTGCGTGAAGAGT\n+TCGAATTATTCAGCCATAATTTACATTTCGACAAATGTAATTTACTCTGTAAAAAGCTATTTCAATATTA\n+GCTGTATAATATATAGTTAAAAATAATCCTGTTAAAATTTGGATTATTAAACATAAAGCAAGGAGAGATC\n+CAAAATTTCATCAAATTGAAATGTTTGATGGGGTGGGTAAATCAATTAGGGATCCATTAATAATTTTTAA\n+AATTGGGTGAGTTTTTCGAATTGGTTTGAATATATTTATCATTAATTTCTAAAGATTCGTAATGGCCCAT\n+AAAAAATATTAGTAATTTTAACAATTGCAATTAGTGTAATAAATAAATAAATAATTAATAGTAATATTAA\n+TATTGAAAAATTATTATTATATAATTTATTTAAATTAATTTTATTTTCATTATTAAAAAATATAAAATTT\n+AATAAGTTGTTTATTTCTGAGTTATTAATTAAATTTATTCAATTTAGATTTTTATAAAATAAAAATTGAA\n+TTATAATTATTAAAATTAATAATGATATGAGAATAATTTTTATTTTATTTGATAAGGAAAATATTTCATT\n+TGATGCAATACTTGAAACATAAATAAATAAAACTAATAATCCTCCTAAAAAAGTTAAAAAAAGAATATAA\n+GAGAATCAATAGGTTTTAATTAATATTCCTGATAATAAACATGTTATTAATGTTTGAATTAAAATTAATA\n+TTCCTATTGATAATGGGTGGTTTAAAAAATATATTATTATTGATATAAAAATAATGAGTATAGATAAATT\n+TAATTTTATCATTTATAATCAAAAAATAGTTTATTAAAATAATAATTTTGGAGATTATAGATAAAGAATT\n+TTCTTTTTTTTTGAGTTTTTAAAGATATTTCTTAATTTTGATTTACAAGACCAATGTTTTTTTTTAAACT\n+ATAAAAACTAAATTAATGATAATTTTAAATATATGATTTATTTTTATTTTAATATTTTTTATTGGGAATT\n+TGATTTTTGTTTCAAAAAATAAGCATTTATTAATTGTTTTATTAAGATTAGAATTTATTGTTTTAAGAAT\n+TTTTTTTTTTTTTTTAGTATTTTTAATAATAATTGATTATGATATATATATATTAATGGTATTTTTAGTT\n+TTTTCTGTTTGTGAAGGTTCATTAGGGTTATCTATTTTAGTTTCTATAATTCGAACTCATGGTAATGATT\n+ATTTTCAAAGATTTAATTTAATTTAAAAATGATAAAAATTTTATTTTATATAATTTTTATAATTCCTTTA\n+TGTTTTATAAAGAAAATATTTTGAATGGTTCAAATATTATTATTAATATTAATATTTATTTATATAAATT\n+TATCAGTAAGTTTGATTAGTTGTAATTTAAGTTATATATATTCTTGTGATTTAATTTCTTTTGGGTTGAT\n+TTTATTAAGAATTTGGATTTGTTCTTTGATAATTATATCTAGAGAAAATTTATTTAAAATAAATTATTAT\n+GTTAATTTTTTTTTATTAAATATTATAATTTTAATAATTTTATTATTTTTAACTTTTAGAGTAATAAATT\n+TATTCATATTTTATTTATTTTTTGAGGGTAGATTAATTCCTACATTGTTATTAATTATTGGGTGGGGGTA\n+TCAACCTGAACGGATTCAAGCTGGAATATATTTAATATTTTATACTTTATTTGCTTCATTACCATTATTA\n+ATAGGGTTATTTTATATTTATATAGAAATTAATAGAATAGTATTTTATTTTTTAAAATTTTTTAATATAA\n+ATTTTATTTTATTATATATTAGAATAGTTTTAGCTTTTTTAGTAAAAATACCTATATATTTTGTTCATTT\n+ATGGCTTCCTAAAGCTCATGTAGAAGCTCCTGTATCAGGGTCTATAATTTTAGCTGGGATTATATTAAAG\n+TTAGGAGGTTATGGGTTATTGCGAGTTTTAATTTTTTTACAAGAAATTAATTTAAAATTAAATTATATGT\n+GAATTATTATTAGATTATTGGGGGGTTTTTATATTAGTCTAAAATGTTTTTGTCAAGTAGATATTAAATC\n+ATTAATTGCTTATTCTTCAGTTTCTCATATAAGAATTGTAATTAGAGGGATTATAGTAATAAATTATTGA\n+GGATATTTTGGTGCATATATTATAATAATTGGTCATGGGTTATGTTCTTCAGGGATATTTTGTCTCGCTA\n+ATATTAATTATGAACGATTACATAGACGAAGATTATTTATTAATAAGGGTATGATAAATTTTATACCTTC\n+AATAAGATTGTGATGATTTTTATTAATGTCTTCAAATATATCAGCTCCTCCATCTTTAAATTTATTAGGG\n+GAAATTAGTTTAATTAATAGAATAATAAGATGATCTTGAATATCAATAATAATATTAATATTAATTTCTT\n+TTTTTAGAGCTGGGTATAGATTATATTTATATTCTTATATTCAACATGGTAAGATTTTTCAAGGGGTATA\n+TAGATTTTATTGTGGTGTTTCTCGTGAATATTTATTATTATTATTACATTGATTACCTTTAAATATTATA\n+ATTTTAAAAATTGAATATTTAATAATTTAATAAAATTTAAATAATTTAATTAAAATATTGATTTGTGGAA\n+TCAAATATATGATATAGTATCATTTTAAATTATTAATAAAAATAATTTTTGTTTTTTTGTTTTTTTGTTT\n+TTGTTTTTTTTTAGAATAATAAATTTATTTTTGATAATTTATTTTATTATAAATAATATTGTATTTTTTT\n+TTGAGTGGGAAATTATTTCTTTTAATTCTGTGAGAGTTGTTATATCTATTTTATTAGATTGAATATCTTT\n+AATATTTATGATGTTTGTTT'..b'TAAATTATAT\n+TTTAGTGTATGATGCACAATAGTTTTTGATACTATTAGGTATAGTTTAATTCTATAAAATATAATAAAGG\n+TAGAAAAACTACTTAATTTATCCTATCAGAATAATCCTTTAATCAGGCACTTTATTTTTAAAAAAAAGGG\n+TTATCCTTTATATTTGAGGTATGAGCCCAAAAGCTTATTTTAGCTTATTTTTAATAATTTTTTTTTTTAT\n+TTATATGAATTTTTTTTACAAATGGTCTAAAAAAATTTTAAATTAATTTTATTTATAATTAATTTATTTG\n+TAAATATATGTATATTTATATATATATATATATGTATATTAAAAATTTAATTTATTAATCATTTTATAAT\n+ATATTAATTTTTTAATTTATATATATATATATTAATATATTAAATTATTGTAAAAAAATAAATAATAATT\n+ATATAAATTTAATATTATTTATTAAATTATAAAATTTTATATAGCAATTTTATATTTATATTTAATATTA\n+TTTAGAGAGAGAGAGAAAATATAAATTGTTTAATAATTTATATTAATTATTTTAATTAATTAATATAATT\n+AATATATATATTAATTATTTATATATAAAAAAAAAAAAAAAAAAAATTCTATGTGAAAAATTTTACATAT\n+AAATAAATTTTTTATGGTTTATAAATTTTATTTTAAATTTATTTTACATGTAAATTTTAGTGTTATATAT\n+TAATTATTTAAATAATATTTAATTTTAATGCAGTAATTAATTTTAAAAATTTAAGAAATTAAGATTTAGT\n+AATATTTAAATTAATAACTAATTTTGTGCCAGCAGTTGCGGTTATACAAAAATTAATTTAAAATTTTTTA\n+GTAATTAATAAGTAATGTTAATTAATAATTTAAATAAGAAATTATTAGGTGAAATTTTAATTTTTTAAAA\n+ATTATTTATATATTATGATTTAATAAATTTTGTAAAAAACTAGGATTAGATACCCTATTATTAAAAATTA\n+AATTTTTAATACTAAAATAGTAAATAATTTATTGAAACTTAAATAATTTGGCGGTATTTTAGTTTATTTA\n+GAGGAATCTGTTTAATAATTGATAATCCACGAATAAATTTACTTAATTTAAAATTTTGTATATCGTTGTT\n+AAAAAAATATTTTATAATAATAATAATATTTAAAAATTTTTATATAAAATGAAATCAGATCAAGATGCAG\n+ATTATAATTAAGAATATAATGGATTACAATAAATTTATTTAAATTGGATTTTAATATGAAAAGATTAAAT\n+GAAATTGGATTTAAATGTAATTTTATAAAATTTTATAAAATGATTAATAATTAAAATATGTACATATTGC\n+CCGTCGCTTTCATTTATAAATTGGAATAAGTCGTAACAAAGTAGAGGTACTGGAAAGTGTTTCTAGAAAG\n+ATCAAATTAGAGCTTGAATAAAGTATTTCATTTACATTGAAAAGATATTATATAAATTAATTAATTTGGG\n+GGGTAAAATTAATAATTTATATTTAATAAAAGAAATTTTAATATTAGAAATATTTAATGGGGGTTAAAGT\n+ATTTTTAATTGAAAAAATTTAAAATTTTATAGTGAATTAGTATTGTGAAAGAATTTTGAAATAATAATTT\n+AAATAATAATTAATTTGAAAGTAAATTTTATTTATTGTATCTTGTGTATCAGAGTTTATTAAAAATTTTT\n+TATTTATATAAATTTCTCGAATTTAAAAGAGTTAATTAATTAAAAATTTTATTGTTTCATAAATATTTTA\n+AATAATTAATTAGAAATGAAATGTTAATCGTTTTTAAATATATCTAGTTATTTTAGAAAAAAATTTAATT\n+TTTAATTTAAATTTAAAATTAATTAATTAATTAATTAATTTTAAATTTAAATTTAATATTTTAAGGGATA\n+AGCTTTAATTTAAATTTTTATAATAATTATTTTTAAATTTTTGAAAATTTTATAATTTATATTGTTAATA\n+AATTTTAATTTATTATAAATAATTTCAATAAAATTAAAAATTTAATTAAAATTTAATTTTTTATAAAAAA\n+ATTTTTTTTTATTATATAAAATTAATTATAATGATAAAATTAGTATATATATATATGTTATGTAATATAA\n+ATAATTATTTAATTGATTAATAAAATAAATTATAATTATAAAAAAGTTATTTTAAAGGAATTCGACAAAA\n+AGTTATATTCACCTGTTTATCAAAAACATGTCTTTTTGATTAATAATTTAAAGTCTAATCTGCCCACTGA\n+TTTAATAATTGAAGGGCTGCAGTATATTGACTGTACAAAGGTAGCATAATCATTAGTCTCTTAATTGGTG\n+ACTTGTATGAAAGATTGGATGAAATATAGATTGTCTCTAAAATATTTAATAGAAATTAATTTTTTAATTA\n+AAAAGTTAAAATAAATTAAAAAGACGAGAAGACCCTATAGAGTTTTATAATTAATTAATTTTTAAATTTT\n+TAATTAATGGTTTATTTTAAAAATTAATAATTATTTTATTGGGGTGATAAAAAAATAAATTAAACTTTTT\n+TTAATTAAAAACATAAATAAGTGGTTAATTGATCCAATATTTTTGATTAAAAGAAAAAATTACCTTAGGG\n+ATAACAGCGTTATTTTTTTTTTTAGCTCAAATAAGAAAAAAAGTTTGCGACCTCGATGTTGGATTAAGAT\n+AAAATTTAAATGCAGAAGTTTAAAATTTTGATCTGTTCGATCATTAAAATCTTACATGATCTGAGTTCAA\n+ACCGGTGTAAGCCAGGTTGGTTTCTATCTTTTAAATATTTTTATATTTTAGTACGAAAGGATTAAATATT\n+ATAATTAAATTAAATTAAGTTGAATTTTATTAATTTAATTAATAAATTTAACTATTTTGGCAGAGAAATG\n+TAATGATTTTAGAAGTCATCAACGTATAATTAATTATATATATAGTAAATGATAGTAATTGATTTTTTAA\n+TAATTTTAGTTGGTTTTTTAATTTTAGTTTTAGGGGTTTTGATTGGGGTTGCTTATTTAACTTTATTAGA\n+GCGAAAAGTTTTAGGTTATATTCAAATTCGAAAAGGTCCTAATAAAGTTGGTTTAATTGGGATTTTTCAA\n+CCATTTTCTGATGCAATTAAGTTATTTACTAAAGAAACTACTTATCCTAATTTTTCTAATTATTATTGTT\n+ATTATTTTTCTCCTGTTGTTAGATTTGTTTTATCTTTAATTATTTGGGTATTAATTCCTTATTATTTTAA\n+CTTAATTAGATTTAGTTTAGGATTAATATTTTTTCTTTGTTGTACTAGAATAGGGGTTTATACAGTTATG\n+ATTGCTGGTTGATCTTCAAATTCTAATTATGCATTACTTGGGGGGTTACGAGCTGTTGCTCAAACAATTT\n+CTTATGAAGTTAGAATGGCTTTAATTTTATTATCTAGAATTATTATAATTATAGATTTCAATTTATTAAG\n+TTTTTTTTATTATCAGAAAATAATTTGAATAATGTTTATGATAATTCCATTATCATTAATATGAGTTTCA\n+TCAATATTAGCTGAAACTAATCGTACTCCTTTTGATTTTGCTGAAGGTGAAAGAGAATTGGTTTCAGGAT\n+TTAATATTGAATATAGAAGTGGGGGATTTGCTTTGATTTTTTTAGCTGAATATTCTAGAATTTTATTTAT\n+AAGAATTTTATTTATTATTATTTATATAGGGGGTTATGATTTAAGAGTAATTTTTTATTTAAAATTAAGA\n+TTAATTTCTTTTTTATTTATTTGAGTTCGGGGTACTTTACCTCGTTATCGATATGATAAATTAATATATT\n+TAGCTTGAAAAAGATATTTACCAGTTTCATTAAATTTTTTATTATTTTTTTTAGGGTTAAAAATTTTTTT\n+TTAATTTGATTATTTTTAGTATAT\n+\n'
b
diff -r 000000000000 -r f6065bc6e428 test-data/related_mitogenome.gb
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/related_mitogenome.gb Sat May 29 12:50:32 2021 +0000
b
b'@@ -0,0 +1,523 @@\n+LOCUS       MW539688               15354 bp    DNA     circular INV 07-MAR-2021\n+DEFINITION  Theretra latreillii lucasii mitochondrion, complete genome.\n+ACCESSION   MW539688\n+VERSION     MW539688.1\n+KEYWORDS    .\n+SOURCE      mitochondrion Theretra latreillii lucasii\n+  ORGANISM  Theretra latreillii lucasii\n+            Eukaryota; Metazoa; Ecdysozoa; Arthropoda; Hexapoda; Insecta;\n+            Pterygota; Neoptera; Endopterygota; Lepidoptera; Glossata;\n+            Ditrysia; Bombycoidea; Sphingidae; Macroglossinae; Macroglossini;\n+            Theretra.\n+REFERENCE   1  (bases 1 to 15354)\n+  AUTHORS   Jiang,C.\n+  TITLE     Direct Submission\n+  JOURNAL   Submitted (26-JAN-2021) College of Life Sciences, Zhejiang Sci-Tech\n+            University, 928 Second Avenue, Xiasha Higher Education Zone,\n+            Hangzhou, Zhejiang 310018, China\n+COMMENT     ##Assembly-Data-START##\n+            Assembly Method       :: Geneious v. 11.0.4\n+            Sequencing Technology :: Illumina\n+            ##Assembly-Data-END##\n+FEATURES             Location/Qualifiers\n+     source          1..15354\n+                     /organism="Theretra latreillii lucasii"\n+                     /organelle="mitochondrion"\n+                     /mol_type="genomic DNA"\n+                     /sub_species="lucasii"\n+                     /db_xref="taxon:1479472"\n+     tRNA            complement(21..85)\n+                     /product="tRNA-Ser"\n+     gene            complement(84..1232)\n+                     /gene="CYTB"\n+     CDS             complement(84..1232)\n+                     /gene="CYTB"\n+                     /codon_start=1\n+                     /transl_table=5\n+                     /product="cytochrome b"\n+                     /protein_id="QSH39803.1"\n+                     /translation="MMNMFKPIRKTHPILKIINGSLIDLPTPSNISIWWNFGSLLALC\n+                     LMIQILTGLFLTMYYTANIEMAFYSVNYICRNVNYGWMIRTLHANGASFFFICIYIHI\n+                     GRGIYYESFNLMYTWLVGVIILFMLMATAFMGYVLPWGQMSFWGATVITNLLSAIPYL\n+                     GNMLVNWIWGGFAVDNATLTRFYTFHFLLPFIILMLTMIHLLFLHQTGSNNPLGINSN\n+                     LDKIPFHPFFTFKDLIGFIILIFLLTMLTLINPYLLGDPDNFIPANPLVTPIHIQPEW\n+                     YFLFAYAILRSIPNKLGGVIALVMSILILIILPFTFNKKIQGLQFYPLNQLLFWFFII\n+                     MIILLTWIGARPVENPYVITGQILTILYFSYFLLNPILSKYWDKLIFN"\n+     gene            complement(1232..1762)\n+                     /gene="ND6"\n+     CDS             complement(1232..1762)\n+                     /gene="ND6"\n+                     /codon_start=1\n+                     /transl_table=5\n+                     /product="NADH dehydrogenase subunit 6"\n+                     /protein_id="QSH39804.1"\n+                     /translation="MMKLNLSMLIIFMSMMMYFLNHPLSMGMLILIQTLMTCLLSGML\n+                     IKTYWFSYILFLTFLGGLLVLFIYVSSIASNEMFSLSNKMKIILMSLLILMIMIQFLF\n+                     YKNLNWMNLINNSEMNNLLNFMFFNNENKINLNKLYNNNFSMLMLLLIIYLFITLIAI\n+                     VKITNIFYGPLRIFSN"\n+     tRNA            1770..1834\n+                     /product="tRNA-Pro"\n+     tRNA            complement(1834..1898)\n+                     /product="tRNA-Thr"\n+     gene            1906..2196\n+                     /gene="ND4L"\n+     CDS             1906..2196\n+                     /gene="ND4L"\n+                     /codon_start=1\n+                     /transl_table=5\n+                     /product="NADH dehydrogenase subunit 4L"\n+                     /protein_id="QSH39805.1"\n+                     /translation="MMILNMWFIFILMFFIGNLIFVSKNKHLLIVLLSLEFIVLSIFF\n+                     FFLVFLMMIDYDMYMLMVFLVFSVCEGSLGLSILVSMIRTHGNDYFQSFNLI"\n+     gene            2199..3530\n+                     /gene="ND4"\n+     CDS             2199..3530\n+                     /gene="ND4"\n+                     /codon_start=1\n+                     /transl_table=5\n+                     /product="NADH dehydrogenase subunit 4"\n+                     /protein_id="QSH39806.1"\n+                     /translation="MMKILFYMIFMIPLCFMKKMFWMVQMLLLMLMFIYMNLSVSLIS\n+    '..b'12241 aagatttagt aatatttaaa ttaataacta attttgtgcc agcagttgcg gttatacaaa\n+    12301 aattaattta aaatttttta gtaattaata agtaatgtta attaataatt taaataagaa\n+    12361 attattaggt gaaattttaa ttttttaaaa attatttata tattatgatt taataaattt\n+    12421 tgtaaaaaac taggattaga taccctatta ttaaaaatta aatttttaat actaaaatag\n+    12481 taaataattt attgaaactt aaataatttg gcggtatttt agtttattta gaggaatctg\n+    12541 tttaataatt gataatccac gaataaattt acttaattta aaattttgta tatcgttgtt\n+    12601 aaaaaaatat tttataataa taataatatt taaaaatttt tatataaaat gaaatcagat\n+    12661 caagatgcag attataatta agaatataat ggattacaat aaatttattt aaattggatt\n+    12721 ttaatatgaa aagattaaat gaaattggat ttaaatgtaa ttttataaaa ttttataaaa\n+    12781 tgattaataa ttaaaatatg tacatattgc ccgtcgcttt catttataaa ttggaataag\n+    12841 tcgtaacaaa gtagaggtac tggaaagtgt ttctagaaag atcaaattag agcttgaata\n+    12901 aagtatttca tttacattga aaagatatta tataaattaa ttaatttggg gggtaaaatt\n+    12961 aataatttat atttaataaa agaaatttta atattagaaa tatttaatgg gggttaaagt\n+    13021 atttttaatt gaaaaaattt aaaattttat agtgaattag tattgtgaaa gaattttgaa\n+    13081 ataataattt aaataataat taatttgaaa gtaaatttta tttattgtat cttgtgtatc\n+    13141 agagtttatt aaaaattttt tatttatata aatttctcga atttaaaaga gttaattaat\n+    13201 taaaaatttt attgtttcat aaatatttta aataattaat tagaaatgaa atgttaatcg\n+    13261 tttttaaata tatctagtta ttttagaaaa aaatttaatt tttaatttaa atttaaaatt\n+    13321 aattaattaa ttaattaatt ttaaatttaa atttaatatt ttaagggata agctttaatt\n+    13381 taaattttta taataattat ttttaaattt ttgaaaattt tataatttat attgttaata\n+    13441 aattttaatt tattataaat aatttcaata aaattaaaaa tttaattaaa atttaatttt\n+    13501 ttataaaaaa attttttttt attatataaa attaattata atgataaaat tagtatatat\n+    13561 atatatgtta tgtaatataa ataattattt aattgattaa taaaataaat tataattata\n+    13621 aaaaagttat tttaaaggaa ttcgacaaaa agttatattc acctgtttat caaaaacatg\n+    13681 tctttttgat taataattta aagtctaatc tgcccactga tttaataatt gaagggctgc\n+    13741 agtatattga ctgtacaaag gtagcataat cattagtctc ttaattggtg acttgtatga\n+    13801 aagattggat gaaatataga ttgtctctaa aatatttaat agaaattaat tttttaatta\n+    13861 aaaagttaaa ataaattaaa aagacgagaa gaccctatag agttttataa ttaattaatt\n+    13921 tttaaatttt taattaatgg tttattttaa aaattaataa ttattttatt ggggtgataa\n+    13981 aaaaataaat taaacttttt ttaattaaaa acataaataa gtggttaatt gatccaatat\n+    14041 ttttgattaa aagaaaaaat taccttaggg ataacagcgt tatttttttt tttagctcaa\n+    14101 ataagaaaaa aagtttgcga cctcgatgtt ggattaagat aaaatttaaa tgcagaagtt\n+    14161 taaaattttg atctgttcga tcattaaaat cttacatgat ctgagttcaa accggtgtaa\n+    14221 gccaggttgg tttctatctt ttaaatattt ttatatttta gtacgaaagg attaaatatt\n+    14281 ataattaaat taaattaagt tgaattttat taatttaatt aataaattta actattttgg\n+    14341 cagagaaatg taatgatttt agaagtcatc aacgtataat taattatata tatagtaaat\n+    14401 gatagtaatt gattttttaa taattttagt tggtttttta attttagttt taggggtttt\n+    14461 gattggggtt gcttatttaa ctttattaga gcgaaaagtt ttaggttata ttcaaattcg\n+    14521 aaaaggtcct aataaagttg gtttaattgg gatttttcaa ccattttctg atgcaattaa\n+    14581 gttatttact aaagaaacta cttatcctaa tttttctaat tattattgtt attatttttc\n+    14641 tcctgttgtt agatttgttt tatctttaat tatttgggta ttaattcctt attattttaa\n+    14701 cttaattaga tttagtttag gattaatatt ttttctttgt tgtactagaa taggggttta\n+    14761 tacagttatg attgctggtt gatcttcaaa ttctaattat gcattacttg gggggttacg\n+    14821 agctgttgct caaacaattt cttatgaagt tagaatggct ttaattttat tatctagaat\n+    14881 tattataatt atagatttca atttattaag ttttttttat tatcagaaaa taatttgaat\n+    14941 aatgtttatg ataattccat tatcattaat atgagtttca tcaatattag ctgaaactaa\n+    15001 tcgtactcct tttgattttg ctgaaggtga aagagaattg gtttcaggat ttaatattga\n+    15061 atatagaagt gggggatttg ctttgatttt tttagctgaa tattctagaa ttttatttat\n+    15121 aagaatttta tttattatta tttatatagg gggttatgat ttaagagtaa ttttttattt\n+    15181 aaaattaaga ttaatttctt ttttatttat ttgagttcgg ggtactttac ctcgttatcg\n+    15241 atatgataaa ttaatatatt tagcttgaaa aagatattta ccagtttcat taaatttttt\n+    15301 attatttttt ttagggttaa aaattttttt ttaatttgat tatttttagt atat\n+//\n+\n'
b
diff -r 000000000000 -r f6065bc6e428 test-data/related_mitogenome_assembly.fasta
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/related_mitogenome_assembly.fasta Sat May 29 12:50:32 2021 +0000
b
b'@@ -0,0 +1,226 @@\n+>NC_016067.1 Phalera flavescens mitochondrion, complete genome\n+TTAAAAATAAGCTAAAATAAGCTTTTGGGTTCATACCCCCAAAATAAAGGAAATACCTTTTTTTTAAAAA\n+TAAAGTGCCTGATTAAAGGATTATTTTGATAGGATAAATTAAGTAAATAAAATTTACCTTTATTATATTT\n+TATAGAATCAAACTATATTTTATAATATCAAAAATTATTGTGCATTTTACCCTAAAATATAAATAACAAA\n+ATTAATGAATTAATTAAATTCAAAAAAAAGAAAAAATTTTTTTTTTTAAATTTTTTTTTCAAAAAATTCC\n+CCCAAAAAATTTTTTTTTTTTTTTTTAATTTTTAGAACATTAATTTCAATTTCTTCAAATTCTTGATTAG\n+GATGTTGAATTGGTTTAGAAATTAACTTACTTTCTTTTATCCCTATTATTTCTAATTCATTTAATTTATT\n+TGCTTCAGAAGCCTCCTTAAAATATTTTTTAACTCAATCTATTGCCTCAATTAATTTTTTATTTTCAATT\n+TTAATAAATATAATTTTAATAAAAAATTTTGAAATAAATTTAATCATTTCAATTATAATAAATTCTTCAC\n+TACTTATAAAAATAGGTTCTGTACCCTTTCATTTTTGATTTCCTATTATTATTGAAGGTTTATCTTGATT\n+CAATAGTTTTATTTTAATAACATGGCAAAAAATTTCCCCCATAATTTTATTATCATATTATTTTAATAGA\n+AATTTTATTATAATTATTATTATTTTTAATATTATAATTGGAGCAATTGGAGGATTAAATCAAACCTCTT\n+TACGTAAACTTCTAACATTTTCCTCCATTAATAATTTAGGATGAATAATCATAGCAATTTTAATTAGAGA\n+AAATTTATGAATATTTTATTTTTGTTTTTATTCTTTTCTTATTAGAATTATATGTTTATTATTTTATAAT\n+CTTAATATATTTTATATTAATCAACTTTTTATTAATAATATAAATTTTATAATTAAAATTAATTTATTAA\n+TTAATTTTATATCTTTAGGGGGTTTACCCCCTTTTATTGGATTTTTTCCTAAATGAATTATTATTAATTT\n+TTTAATTAATAATAATTTTTACTTTATAACATTTATTTTTGTAATAATAAGATTAATTACATTATTTTTT\n+TATATTCGTATTATTTATTCTTCTTTTATATTTAATTATTTTAAAATAAAATGATTTAAAATTTTTATTA\n+AAAATAATTTATTTTTAATTATTAATTTTTTTTCTTTTATTTCTATTAGAGGAATAATTTTTAGAACTTT\n+TTTTTTTATATAAATAATTTTATTAAAGAAGGTTTTAAGTTAAATAAACTAATAATCTTCAAAATTATTT\n+ATAAAGAAAATAATTGTTCTTTAAGCCTTAATAATAAATTTTATTATTCCTTAAAATTTGCAATTTTATA\n+TCATTATTTGACTATAAGACTTTAATAAAAGAGAAATATATCTCGTAAATAAATTTACAATTTATCGCTT\n+AATCTCAGCCATTTTATTTATAGCGAAAATGACTTTATTCAACAAATCATAAAGATATTGGAACATTATA\n+TTTTATTTTTGGAATTTGAGCAGGAATAGTAGGAACTTCATTAAGATTATTAATTCGAGCAGAATTAGGT\n+AATCCTGGATCTTTAATTGGAGATGATCAAATTTATAATACTATTGTCACAGCACATGCCTTTATTATAA\n+TTTTTTTTATAGTAATACCCATTATAATTGGAGGATTTGGAAATTGATTAGTTCCTTTAATATTAGGAGC\n+CCCAGATATAGCTTTCCCCCGTATAAATAATATAAGTTTCTGACTTTTACCCCCCTCTTTAACTCTTTTA\n+ATTTCAAGAAGAATTGTAGAAAATGGAGCAGGAACTGGATGAACAGTTTACCCCCCACTTTCATCTAATA\n+TTGCACATGGAGGAAGATCTGTTGACTTAGCTATTTTTTCTTTACATTTAGCTGGAATTTCCTCTATTTT\n+AGGAGCAATTAATTTTATTACAACAATTATTAATATACGACTTAATAATATATCTTTTGATCAAATACCT\n+TTATTTATTTGAGCTGTTGGAATTACAGCCTTTCTATTACTTTTATCTTTACCAGTATTAGCTGGAGCAA\n+TTACTATATTATTAACTGACCGAAATTTAAACACTTCTTTTTTTGATCCTGCTGGAGGGGGAGACCCAAT\n+TTTATACCAACATTTATTTTGATTTTTTGGACATCCAGAAGTTTATATTTTAATTTTACCAGGATTTGGG\n+ATAATTTCTCATATTATTTCTCAAGAAAGAGGAAAAAAGGAAACTTTTGGATGTTTAGGTATAATCTATG\n+CAATAATAGCTATTGGTTTATTAGGATTTATTGTTTGAGCTCACCATATATTTACTGTTGGGATAGATAT\n+TGATACTCGAGCTTATTTTACCTCAGCTACTATAATTATTGCCGTACCTACGGGAATTAAAATTTTCAGT\n+TGATTAGCAACTCTTCATGGAACACAAATTAATTATAGTCCTTCAATATTATGAAGATTAGGGTTTGTTT\n+TTTTATTTACTGTTGGAGGTTTAACTGGAGTTGTTTTAGCTAATTCCTCAATTGATATTACTCTTCATGA\n+TACTTATTATGTAGTAGCTCATTTTCATTATGTTCTTTCTATAGGAGCAGTATTTGCAATCTTAGGAGGA\n+TTTGTTCATTGATATCCTTTATTTACAGGATTAAATATAAATCCTTATTTATTAAAAATTCAATTTTTTA\n+TTATATTTATTGGAGTAAATTTAACCTTTTTCCCTCAACATTTTTTAGGGCTTGCAGGTATACCTCGTCG\n+TTATTCTGATTATCCAGATTCATATATTACTTGAAATATTATTTCTTCTTTAGGCTCTTATATTTCTTTA\n+TTAGCAGTAATATTTATTTTAATTATTATTTGAGAGTCTATAATTAATCAACGAATTGCTTTATTTACTT\n+TAAATCTTTCTTCTTCTATTGAGTGATATCAAAATCTACCACCAGCTGAACATTCATATAATGAACTTCC\n+AATTTTAAGTAATTTCTAATATGGCAGATTATATGTAATGGATTTAAACCCCATTTATAAAGGTTTATCC\n+TTTTTTTAGAAATGGCAACATGATCTAATTTAAATTTACAAAATAGAGCTTCTCCTTTAATAGAACAAAT\n+TATTTTTTTCCACGATCATACTTTAATTATTTTAATTATAATTACTATTCTAGTAGGTTATTTAATATTA\n+AGATTATTATTTAATAAATATATTAATCGATTCTTATTAGAAGGTCAAATAATTGAATTAATTTGAACTA\n+TTTTACCAGCAATTACTTTAATTTTTATCGCCCTCCCATCTCTACGATTACTTTATTTACTTGATGAATT\n+AAATAATCCTTTAATTACCCTAAAATCTATTGGGCATCAATGATATTGAAGATATGAATATTCTGATTTT\n+AACAATATTGAATTTGATTCATATATAATTCCCTCTAATGAGTTAAATTCTAATAATTTCCGTTTATTAG\n+ATGTTGATAATCGAATTATTTTACCTATAAATAATCAAATTCGTATTATAGTAACTGCAACTGATGTAAT\n+CCACTCTTGAACAATTCCATCATTAGGTGTAAAAGTAGATGCTAATCCAGGACGTTTAAATCAAACTAAT\n+TTTTTTATAAATCGACCAGGAATTTTTTACGGTCAATGTTCTGAAATTTGTGGAGCTAATCACAGTTTCA\n+TACCAATTGTAATTGAAAGAATTTCAATTAAAAATTTTATTAATTGAATTAATAATTATTCTTCATTAGA\n+TGACTGAAAGCAAGTACTGGTCTCTTAA'..b'TTGTTTTGAAAACTTAAGAAAGAATAAAAATTCTATTAATTTATACTAAAAATAATA\n+TAATATATAAAATATTTAAAGAAAAATTTTTATACCTAAAAAAAATAATAAAAAATTTAATGAAATTGGT\n+AAATAACTTTTCCAAGCTAAATATATAAGCTTATCATATCGATAACGAGGTAAAGTTCCTCGAACTCAAA\n+TAAATAAAAAGGAAATAAAAAATAATTTTAAATAAAAAAAAATTCTTAATACATAACCCCCTAAATATAA\n+TAAAACAAATAATAATCTTATAAATAAAATTCTAGAATATTCTGCTAAAAAAATTAAAGCAAATCCTCCA\n+CTTCTATACTCAACATTAAACCCTGAAACTAATTCTCTCTCACCTTCAGCAAAATCAAAAGGAGTACGAT\n+TAGTTTCTGCTAATCTTGAAGATATTCAACATAATCTTAAAGGAAATATTAAAAAAATAAATCAAATATT\n+TATTTGATAATAATAAAAATTTAATATATTAAAATCTATAATTATAATAATATTAGATATAAAAATTAAT\n+GCTAATCTTACTTCATAAGAAATAGTTTGAGCTACAGCTCGTAGACCCCCTAATAAAGCATAATTAGAAT\n+TAGAAGATCAACCAGCAATTATAACAGTATATACTCCTAATCTTGTACAACAAAGAAAAAATAAAATACC\n+TAAATTAAATCTTACTATATTATAATAATAAGGAATTAATACTCAAATTATTAAAGATAATAAAAATCTA\n+ATTACCGGAGAAAAATAGTAAGATAAATAATTAGAAAAATTAGGATAAGTTTGTTCTTTAGTAAATAATT\n+TAATTGCATCTGAAAAAGGTTGTAAAACTCCTATTAAACCAACTTTATTAGGACCTTTTCGAATTTGGAT\n+ATAACCTAAAACTTTACGTTCTAATAAAGTTAAATATGCAACCCCAATTAAAACCCCTAAAATTAAAATT\n+AATAAACCTAAAAAAATTATATATATATCTTTTAATAACATTTACTATATATATAATTTAACTTTATATA\n+TTTATGATTTCTAAAACCATTACACTTTTCTGCCAAAATAGTTTAAAAAATTCTTAATTTTAATTTTATT\n+TAAATAATTTTTAATTAATAATATTCAATTTAATAAATATAATTTTAATATTTATTCCTTTCGTACTAAA\n+ATATAAAACATAATATAAAAGATAGAAACCAACCTGGCTCACACCGGTTTGAACTCAGATCATGTAAGAT\n+TTTAATGATCGAACAGATCAAAATTTTAAACTTTTGCATTTAAATTTTATCTTAATCCAACATCGAGGTC\n+GCAAACTTTTTTTTTTATTTGAACTAAAAAAAAAAATTACGCTGTTATCCCTAAGGTAATTTTTTCTTTT\n+AATCAATAATATTGGATCATTAAATCATTTATTTATGTTATTAAATAAAAAAAGTTATTTTTATTTTTTT\n+ATCACCCCAATAAAATATTTTTTTTAATTTCAATTTTAATTTTATAAATAATATTAATTAAAAATAAATA\n+TAAAACTCTATAGGGTCTTCTCGTCTTTTTATTTTATTTTAACTTTTTAATTAAAAAATTAAATTCTAAA\n+TTTTAAATAAGAGACAGTCTATATTTCATCCAATCTTTCATGCAAGTCATCAATTAAATGACTATTGATT\n+ATGCTACCTTTGTACAGTCAAAATACTGCAGCCCTTTAATAATAAATCAGTGGGCAGATTAGACTTTAAA\n+TTATTAACAAAAAGACATGTTTTTGATAAACAAGTGAATATAAATATTTGCCGAATTCCTTTTATTTAAT\n+TTTAAATTAAAATAAAAATTTTAATTTAATTAATATACTAATTTTATCATTATAACTAATTTTTATTTAT\n+TAAAAATTATTTTTTTATAAAAATATAAATTATCTTAAAAATTTTATACATATTATTGAAATTATTTATA\n+ATAAAATAAAATTTATTAACAATATAAATTATAAAATTTTCAATTTAAATTAAAAATTATTATATAATTT\n+TAATTTAAAGCTTATCCCTTAAAATATAAAAATTTTATAAAAAAAAATTTATTAATGAATTTTTTTTTAT\n+AAAATTTTAAAATTAAATTTTTTTCTAAAAAAACTAGATATATTTAAAAACGATTAACATATCATTTCTA\n+ATTAATTATTTAAAATATTTATGCTACAATAACTTTATTAAATTAATTATCTCTTTTAAATTCGAGAAAT\n+TTTTTCTTAAAAATAATTTTTAATAAACTCTGATACACAAGATACATTAAATAAAAATTACTTTTAAAAT\n+AATTTTATATTTCAAATTATTTCAAAATTCTTTCACAATACTAATTTACTATAAATTTTTCAATTTTTTT\n+TATTAAAATACTTTAACCCCCATTAAATATTTTAATTATAAAAATTCTTTTATTAATTATAAATTAATTA\n+ATTTACCCCCTCAAATTAATTAATTTTTACTAATATCTTTTCAATGTAAATGAAATACTTAAATCAAGCT\n+CTAATTTGTCTTTCTAGAAACACTTTCCAGTACCTCTACTTTGTTACGACTTATTTCAATTTAATATATT\n+AAAATACATTTTATATATGAAAGCGACGGGCAATATGTACATATTTTAATTTTCAATCATTTTATTAAAT\n+TAAATAAAATTACATTTAAATCCACCTTCAATTAAATTTTTTAAATTAATATTCATATAAATTAATTTAT\n+TGTAATCCATTATATTCTTAATTATAATCTGCATCTTGATCTGATTTAAATTCTTATAAAAAATTTAAAA\n+TATTATTTTTATTAAAAAATATTTTTTTAACAACGATATACAAAATAATAAATTAAGTAAATTTATTCGT\n+GGATTATCAATTATTAAACAGATTCCTCTAAATGAACTAAAATACCGCCAACTTATTTAAGTTTCAATAA\n+ATTATTATTTACTATTTTAGTATTATAAAATTTAAATTTTAATAATAGGGTATCTAATCCTAGTTTTTTA\n+TAAAATTTATTAAATCATAATTTTAATATAAATTTTAATTAAATTAAAATTTCACCTAATAATTTAAAAT\n+TTTTAATATTTATTATTTATTAATTAATTACCTACAAAATTTAATTTAACTTTTGTATAACCGCCAACTT\n+ATTTAAGTTTCAATAAATTATTATTTACTATTTTAGTATTATAAAATTTAAATTTTAATAATAGGGTATC\n+TAATCCTAGTTTTTTATAAAATTTATTAAATCATAATTTTAATATAAATTTTAATTAAATTAAAATTTCA\n+CCTAATAATTTAAAATTTTTAATATTTATTATTTATTAATTAATTACCTACAAAATTTAATTTAACTTTT\n+ATATAACTGTAACTATAGATTTTTTTTTTTTTTTTAATTTTAATATAACTAAATCTTAATTTCTTAAATT\n+TTTAATATTAATTACTACATTAAAACTTCAATTATTATTAAAATAATTAAAATCTAACACTAAAATTTAT\n+ATGTAAAATAAATTTAAAATAAATTCTTTAAACAGTAAACTTTTTACTTATATACAATTTTTTTTAAATA\n+GAAATTTTTTTTTTTTTTTTATATTAAAATATTTTTATATATTATAAATATTAAATAATTTATAATATAA\n+GTTTTAAACATTGAATAATTTCTCTTTTTTTTTTTTATAATATTCATATTAAAAACAAACTTGGAAATTA\n+AAACTTGATAATTTTTATATTTAACCATATATATATATAATTTTTATTTATTTTTTTACCTTAAGTTAAA\n+GAATAATAAATATAATTATATTTTAAAAATTTAATATATATATATTTTATATATAATATAAAAATTAATT\n+TTTTAATTAATTTTTACCCTTTTTTATAATTTTACATATAAATAAAAAA\n+\n'
b
diff -r 000000000000 -r f6065bc6e428 test-data/related_mitogenome_assembly.gb
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/related_mitogenome_assembly.gb Sat May 29 12:50:32 2021 +0000
b
b'@@ -0,0 +1,618 @@\n+LOCUS       NC_016067              15659 bp    DNA     circular INV 21-DEC-2012\n+DEFINITION  Phalera flavescens mitochondrion, complete genome.\n+ACCESSION   NC_016067\n+VERSION     NC_016067.1\n+DBLINK      Project: 74315\n+            BioProject: PRJNA74315\n+KEYWORDS    RefSeq.\n+SOURCE      mitochondrion Phalera flavescens (Japanese buff-tip moth)\n+  ORGANISM  Phalera flavescens\n+            Eukaryota; Metazoa; Ecdysozoa; Arthropoda; Hexapoda; Insecta;\n+            Pterygota; Neoptera; Holometabola; Lepidoptera; Glossata; Ditrysia;\n+            Noctuoidea; Notodontidae; Phalerinae; Phalera.\n+REFERENCE   1  (bases 1 to 15659)\n+  AUTHORS   Sun,Q.Q., Sun,X.Y., Wang,X.C., Gai,Y.H., Hu,J., Zhu,C.D. and\n+            Hao,J.S.\n+  TITLE     Complete sequence of the mitochondrial genome of the Japanese\n+            buff-tip moth, Phalera flavescens (Lepidoptera: Notodontidae)\n+  JOURNAL   Genet. Mol. Res. 11 (AOP) (2012) In press\n+   PUBMED   23079966\n+  REMARK    Publication Status: Available-Online prior to print\n+REFERENCE   2  (bases 1 to 15659)\n+  CONSRTM   NCBI Genome Project\n+  TITLE     Direct Submission\n+  JOURNAL   Submitted (13-OCT-2011) National Center for Biotechnology\n+            Information, NIH, Bethesda, MD 20894, USA\n+REFERENCE   3  (bases 1 to 15659)\n+  AUTHORS   Sun,Q.-Q. and Hao,J.-S.\n+  TITLE     Direct Submission\n+  JOURNAL   Submitted (28-FEB-2011) College of Life Sciences, Anhui Normal\n+            University, No. 1 Peking East Road, Wuhu, Anhui 241000, China\n+COMMENT     REVIEWED REFSEQ: This record has been curated by NCBI staff. The\n+            reference sequence is identical to JF440342.\n+            COMPLETENESS: full length.\n+FEATURES             Location/Qualifiers\n+     source          1..15659\n+                     /organism="Phalera flavescens"\n+                     /organelle="mitochondrion"\n+                     /mol_type="genomic DNA"\n+                     /db_xref="taxon:13634"\n+     tRNA            1..68\n+                     /product="tRNA-Met"\n+                     /anticodon=(pos:32..34,aa:Met,seq:cat)\n+     tRNA            69..135\n+                     /product="tRNA-Ile"\n+                     /anticodon=(pos:98..100,aa:Ile,seq:gat)\n+     tRNA            complement(133..201)\n+                     /product="tRNA-Gln"\n+                     /anticodon=(pos:complement(169..171),aa:Gln,seq:ttg)\n+     gene            260..1273\n+                     /gene="ND2"\n+                     /db_xref="GeneID:11256396"\n+     CDS             260..1273\n+                     /gene="ND2"\n+                     /codon_start=1\n+                     /transl_table=5\n+                     /product="NADH dehydrogenase subunit 2"\n+                     /protein_id="YP_004891565.1"\n+                     /db_xref="GeneID:11256396"\n+                     /translation="MFFSKNSPKKFFFFFLIFSTLISISSNSWLGCWIGLEINLLSFI\n+                     PIISNSFNLFASEASLKYFLTQSIASINFLFSILMNMILMKNFEMNLIISIMMNSSLL\n+                     MKMGSVPFHFWFPIIIEGLSWFNSFILMTWQKISPMILLSYYFNSNFIMIIIIFNIMI\n+                     GAIGGLNQTSLRKLLTFSSINNLGWMIMAILISENLWMFYFCFYSFLISIMCLLFYNL\n+                     NMFYINQLFINNMNFMIKINLLINFMSLGGLPPFIGFFPKWIIINFLINNNFYFMTFI\n+                     FVMMSLITLFFYIRIIYSSFMFNYFKMKWFKIFIKNNLFLIINFFSFISISGMIFSTF\n+                     FFM"\n+     tRNA            1289..1360\n+                     /product="tRNA-Trp"\n+                     /anticodon=(pos:1319..1321,aa:Trp,seq:tca)\n+     tRNA            complement(1353..1421)\n+                     /product="tRNA-Cys"\n+                     /anticodon=(pos:complement(1389..1391),aa:Cys,seq:gca)\n+     tRNA            complement(1423..1488)\n+                     /product="tRNA-Tyr"\n+                     /anticodon=(pos:complement(1456..1458),aa:Tyr,seq:gta)\n+     gene            <1494..3024\n+                     /gene="COX1"\n+                     /gene_synonym="COI"\n+                     /db_xref="GeneID:11256397"\n+     CDS             <1494..3024\n+                     '..b' aaaaatagta agataaataa ttagaaaaat taggataagt ttgttcttta gtaaataatt\n+    12601 taattgcatc tgaaaaaggt tgtaaaactc ctattaaacc aactttatta ggaccttttc\n+    12661 gaatttggat ataacctaaa actttacgtt ctaataaagt taaatatgca accccaatta\n+    12721 aaacccctaa aattaaaatt aataaaccta aaaaaattat atatatatct tttaataaca\n+    12781 tttactatat atataattta actttatata tttatgattt ctaaaaccat tacacttttc\n+    12841 tgccaaaata gtttaaaaaa ttcttaattt taattttatt taaataattt ttaattaata\n+    12901 atattcaatt taataaatat aattttaata tttattcctt tcgtactaaa atataaaaca\n+    12961 taatataaaa gatagaaacc aacctggctc acaccggttt gaactcagat catgtaagat\n+    13021 tttaatgatc gaacagatca aaattttaaa cttttgcatt taaattttat cttaatccaa\n+    13081 catcgaggtc gcaaactttt ttttttattt gaactaaaaa aaaaaattac gctgttatcc\n+    13141 ctaaggtaat tttttctttt aatcaataat attggatcat taaatcattt atttatgtta\n+    13201 ttaaataaaa aaagttattt ttattttttt atcaccccaa taaaatattt tttttaattt\n+    13261 caattttaat tttataaata atattaatta aaaataaata taaaactcta tagggtcttc\n+    13321 tcgtcttttt attttatttt aactttttaa ttaaaaaatt aaattctaaa ttttaaataa\n+    13381 gagacagtct atatttcatc caatctttca tgcaagtcat caattaaatg actattgatt\n+    13441 atgctacctt tgtacagtca aaatactgca gccctttaat aataaatcag tgggcagatt\n+    13501 agactttaaa ttattaacaa aaagacatgt ttttgataaa caagtgaata taaatatttg\n+    13561 ccgaattcct tttatttaat tttaaattaa aataaaaatt ttaatttaat taatatacta\n+    13621 attttatcat tataactaat ttttatttat taaaaattat ttttttataa aaatataaat\n+    13681 tatcttaaaa attttataca tattattgaa attatttata ataaaataaa atttattaac\n+    13741 aatataaatt ataaaatttt caatttaaat taaaaattat tatataattt taatttaaag\n+    13801 cttatccctt aaaatataaa aattttataa aaaaaaattt attaatgaat ttttttttat\n+    13861 aaaattttaa aattaaattt ttttctaaaa aaactagata tatttaaaaa cgattaacat\n+    13921 atcatttcta attaattatt taaaatattt atgctacaat aactttatta aattaattat\n+    13981 ctcttttaaa ttcgagaaat tttttcttaa aaataatttt taataaactc tgatacacaa\n+    14041 gatacattaa ataaaaatta cttttaaaat aattttatat ttcaaattat ttcaaaattc\n+    14101 tttcacaata ctaatttact ataaattttt caattttttt tattaaaata ctttaacccc\n+    14161 cattaaatat tttaattata aaaattcttt tattaattat aaattaatta atttaccccc\n+    14221 tcaaattaat taatttttac taatatcttt tcaatgtaaa tgaaatactt aaatcaagct\n+    14281 ctaatttgtc tttctagaaa cactttccag tacctctact ttgttacgac ttatttcaat\n+    14341 ttaatatatt aaaatacatt ttatatatga aagcgacggg caatatgtac atattttaat\n+    14401 tttcaatcat tttattaaat taaataaaat tacatttaaa tccaccttca attaaatttt\n+    14461 ttaaattaat attcatataa attaatttat tgtaatccat tatattctta attataatct\n+    14521 gcatcttgat ctgatttaaa ttcttataaa aaatttaaaa tattattttt attaaaaaat\n+    14581 atttttttaa caacgatata caaaataata aattaagtaa atttattcgt ggattatcaa\n+    14641 ttattaaaca gattcctcta aatgaactaa aataccgcca acttatttaa gtttcaataa\n+    14701 attattattt actattttag tattataaaa tttaaatttt aataataggg tatctaatcc\n+    14761 tagtttttta taaaatttat taaatcataa ttttaatata aattttaatt aaattaaaat\n+    14821 ttcacctaat aatttaaaat ttttaatatt tattatttat taattaatta cctacaaaat\n+    14881 ttaatttaac ttttgtataa ccgccaactt atttaagttt caataaatta ttatttacta\n+    14941 ttttagtatt ataaaattta aattttaata atagggtatc taatcctagt tttttataaa\n+    15001 atttattaaa tcataatttt aatataaatt ttaattaaat taaaatttca cctaataatt\n+    15061 taaaattttt aatatttatt atttattaat taattaccta caaaatttaa tttaactttt\n+    15121 atataactgt aactatagat tttttttttt tttttaattt taatataact aaatcttaat\n+    15181 ttcttaaatt tttaatatta attactacat taaaacttca attattatta aaataattaa\n+    15241 aatctaacac taaaatttat atgtaaaata aatttaaaat aaattcttta aacagtaaac\n+    15301 tttttactta tatacaattt tttttaaata gaaatttttt tttttttttt atattaaaat\n+    15361 atttttatat attataaata ttaaataatt tataatataa gttttaaaca ttgaataatt\n+    15421 tctctttttt ttttttataa tattcatatt aaaaacaaac ttggaaatta aaacttgata\n+    15481 atttttatat ttaaccatat atatatataa tttttattta tttttttacc ttaagttaaa\n+    15541 gaataataaa tataattata ttttaaaaat ttaatatata tatattttat atataatata\n+    15601 aaaattaatt ttttaattaa tttttaccct tttttataat tttacatata aataaaaaa\n+//\n+\n'