Previous changeset 11:15b23cdde685 (2018-04-20) Next changeset 13:734a3572c1d6 (2019-01-08) |
Commit message:
planemo upload commit 11382afe87364aaafb19973470d5066229a6e34f |
modified:
GetHaplotypesFromPhasedVCF/GetHaplotypesFromPhasedVCF.pl GetHaplotypesFromPhasedVCF/getHaplotypesFromPhasedVCF.xml |
added:
test-data/getHaplotypesFromPhasedVCF-result.distinct_haplotypes.fas |
b |
diff -r 15b23cdde685 -r 88748d846a20 GetHaplotypesFromPhasedVCF/GetHaplotypesFromPhasedVCF.pl --- a/GetHaplotypesFromPhasedVCF/GetHaplotypesFromPhasedVCF.pl Fri Apr 20 09:04:25 2018 -0400 +++ b/GetHaplotypesFromPhasedVCF/GetHaplotypesFromPhasedVCF.pl Tue Aug 14 08:21:55 2018 -0400 |
b |
@@ -7,6 +7,7 @@ open(O1,">$out.haplo.fas"); open(O2,">$out.distinct_haplotypes.txt"); +open(O3,">$out.distinct_haplotypes.fa"); my %indiv; my %genes; @@ -96,13 +97,15 @@ my $nb = $haplos{$gene}{$haplo}; my $ind = $haplotypes2{$gene}{$haplo}; print O2 $haplo_name.":$nb:".$haplotypes2{$gene}{$haplo}."\n".$haplo."\n"; - if ($nb > 1){ - #print "$nb \n"; + if ($nb >= 1){ + print O3 ">".$haplo_name."|$nb\n"; + print O3 $haplo."\n"; } } } close(O1); -close(O1); +close(O2); +close(O3); #print scalar keys(%haplos); |
b |
diff -r 15b23cdde685 -r 88748d846a20 GetHaplotypesFromPhasedVCF/getHaplotypesFromPhasedVCF.xml --- a/GetHaplotypesFromPhasedVCF/getHaplotypesFromPhasedVCF.xml Fri Apr 20 09:04:25 2018 -0400 +++ b/GetHaplotypesFromPhasedVCF/getHaplotypesFromPhasedVCF.xml Tue Aug 14 08:21:55 2018 -0400 |
[ |
@@ -8,7 +8,7 @@ <exit_code range="1:" /> </stdio> <command interpreter="perl"> - GetHaplotypesFromPhasedVCF.pl $input $output_label && mv ${output_label}.distinct_haplotypes.txt $output_distinct && mv ${output_label}.haplo.fas $output_haplo + GetHaplotypesFromPhasedVCF.pl $input $output_label && mv ${output_label}.distinct_haplotypes.txt $output_distinct && mv ${output_label}.haplo.fas $output_haplo && mv ${output_label}.distinct_haplotypes.fa $output_distinct_fasta </command> <inputs> <param type="data" name="input" format="vcf" label="Phased VCF" /> @@ -17,12 +17,14 @@ <outputs> <data name="output_distinct" format="txt" label="${output_label}.distinct_haplotypes.txt"/> <data name="output_haplo" format="fasta" label="${output_label}.haplo.fas"/> + <data name="output_distinct_fasta" format="fasta" label="${output_label}.distinct_haplotypes.fa"/> </outputs> <tests> <test> <param name="input" value="getHaplotypesFromPhasedVCF-input.vcf"/> <output name="output_distinct" file="getHaplotypesFromPhasedVCF-result.distinct_haplotypes.txt" compare="sim_size" delta="0"/> <output name="output_haplo" file="getHaplotypesFromPhasedVCF-result.haplo.fas" compare="sim_size" delta="0"/> + <output name="output_distinct_fasta" file="getHaplotypesFromPhasedVCF-result.distinct_haplotypes.fas" compare="sim_size" delta="0"/> </test> </tests> <help><![CDATA[ @@ -72,12 +74,16 @@ ------------ -Text file - File describing haplotypes +Distinct Haplotypes text file + File describing distincts haplotypes Fasta file Fasta file with haplotypes +Distinct Haplotypes fasta file + Fasta file with distincts haplotypes + + --------------------------------------------------- --------------- @@ -131,6 +137,23 @@ >Chr10_AZUCENA_2 TAAATCTTGGTGCTGATCTGATATTTAATGCGT +haplotypes.distinct_haplotypes.fas +---------------------------------- + +:: + + >haplo1|2 + CAATTTATATATACTTGTATATAACCACAACGAGAGAGTTTTACCT + TTTATAAAAAATAAATAATGTATTACGGCTAATATAGCAATCTTTT + AAAATAAATCTATATTTAAATGACTATGGAATTACTAATCACAATA + ACAGGATCTTGTTATTTTTAGCTTGTGTACTTATAATGATCCGATG + >haplo2|2 + GCTACTTAAATATCTAGCATTAATCCACAACGAGAGGCTCTTACCT + TTAAAAAAGGGTCATCGCCTATAGGTTAGATAATCGACACATATAA + TTATAAGAAATTATATATAATTTTTAATCTAGTTCATTCTTGTGCA + TCATTATGTTATATAATAATAAACGTAACAAATATTGATACTACTC + + ]]></help> <citations> <!-- [HELP] As DOI or BibTex entry --> |
b |
diff -r 15b23cdde685 -r 88748d846a20 test-data/getHaplotypesFromPhasedVCF-result.distinct_haplotypes.fas --- /dev/null Thu Jan 01 00:00:00 1970 +0000 +++ b/test-data/getHaplotypesFromPhasedVCF-result.distinct_haplotypes.fas Tue Aug 14 08:21:55 2018 -0400 |
b |
b'@@ -0,0 +1,3980 @@\n+>haplo1|2\n+CAATTTATATATACTTGTATATAACCACAACGAGAGAGTTTTACCTTTAAAAAAGGGTCATCGCCTTTAGGTTAGATAATCGACACATATAATTATAAGGAATTATATATAATTTTTAATCTAGTTCATTCTTGTGCATCATTATGTTATATAATAATAAACGTAACAAATTTTGATACTACTCATGAGTAGATTTAAGGTGATTTTATAAAAAATAAATAATGTATTACGGCTAATATAGCAATCTTTTAAAATAAATCTATATTTAAATGACTATGGAATTACTAATCACAATAACAGGATCTTGTTATTTTTAGCTTGTGTACTTATAATGATCCGATGTACTTAATTCTCAGCTCCTCATAATCTGTAGATATAAATATACATCGAAATCTGATAAAATGTTAGAACTTTTAATAAATTTATTATAATAGAATTTTTTATTATTGGGTCATAATATGTTATTAGACAGAAATTGCTAAATTTTTCTATAGAGAGTAGTATAATGATGTCACAATTGTCATCTAAAATAACTAATATTTGAATTCTACAAAAATACATCGAGTTTAGAACAACCCCCATCTATATATAATATTATAAAATATTTATAGAAGTTTAAATAATGAATTTTGCTTTTCTATTAACATCGTAATATATCTATAATGTATACTATTAATCAAATTCTATTAATTATATATACGCAATATTATATTAAAATAATGGATGTCATGTGTTAATATAATACATTTATCGATTAGAGAATATAAAGATAATTATTAAGCCAATTCTATTTAAAGATAGATTAATTTTATAAGAATACAATTTAAGTATCTTGATAAAATTTTTTAATATTCTCACTACTATTTATTAACCTATGTAGATGTTACATAAAAGACTATTAAACATTAAATATAATATATTGGCTATAAGGAAGTTTTATATCTTTAATAACTGAATGCCAAATTTCATTTCAAATGAGATTTGCAATATAGACCTTATTAAAATAATAATTATTTTATCGGTAGCTAAATCTTATCTATTCCTCTGTCCATATTAAATATGGTTCGTCTAGACCGAATGGTAAAATTATTTAATGTATATAATATCACGTTGAACGAAATAAATTTATTCTTGATAAATTAGTCATTCACATTTTGTTCATTATTATTAATAATATATATATTGTCTCTTTGAGACTTTTAGATATTTAATGTGCAAGTGTCATAACTTTAAATTAGCTTATTTAGAAAATTAAGTCTACTAATATCGGACTTACAGGTAGCACCAAATCGATTATGAGCAAACTATATCA\n+>haplo2|2\n+GCTACTTAAATATCTAGCATTAATCCACAACGAGAGGCTCTTACCTTTAAAAAAGGGTCATCGCCTATAGGTTAGATAATCGACACATATAATTATAAGAAATTATATATAATTTTTAATCTAGTTCATTCTTGTGCATCATTATGTTATATAATAATAAACGTAACAAATATTGATACTACTCATGAGTAGATTTAAGGTGATTTTATAAAATATAAATAATGTATTACGGCTAATATAGCTTACTTTATAAATAAATCTATATTTAAATGTCTATGGAATTACTAATCACAATAACAGGATCTTGTTATTTTTAGCTTGTGTACTTATAATGATCCGATGTACTTAATTCTCAGCTCCTCAGATTCTGTAGATATAAATATACATCGAAATCAGATAAAATGTAAGAACTCTTAATAAATTTATTATAATAGAATTTTTTATTATTGGGTCATAATATGTTATTAGACAGAAATTGCTAAATTTTTCTATAGAGAGTAGTATAATGATGTCACAATTGTCATCTAAAATAACTAATATTTGAATTCTACAATAATACATCGAGTTTAGAACAACCCCCATTTTTATATAATATTTTAAAATATTTATAGAAGTTTAAATAATGAATTTTGGTCAACTATTGATATCGTAATATATCTATAATACTATGATAATTAAGTTTCTAACTGATAGAATTAACGCAATATTATATTAAAATAATGAATGTCATGTGTTAAAAATATACAGTTTTGGGTTAGTGAATATAAAGATAATTATTAAGCCAATACTAAATAAAGTTTATAATAAAAATATTTAATACAATTTATAGTACTAGTACATTTATTTTAATGTTCTCTTAACTATTTATTTACCGATACTGAAGATATTTTTTAATCTTAATAAATAATATAATAATAATTTAGCTATAAGGAAGTTTTATATCTTGATCTTTCGTGAGCCAAATTTCATTTCAAATGAGATTTGCAATATAGACCTTATTAAAATATATGTGACCTAATCGGTAGCTAAATCTTATCTATTCCTCTGTCCATATTAAATATGGTTCGTCTAGACCGATAGGTAAAATTATTTAATGTATATAATATCACGTTGAACGAAATAAATTTATTCTTGATAAATTAGTCATTCACTTTTTGTTCATTATTATTAATAATATATATATTGTCTCTTTGAGACTTTTAGATATTTAATGTGCAAGTGTCATAACTTTAAATTAGCTTATTTAGAAAATTAAGTCTACTAATATCGGACTTACAGGTAGCACCAAATCGATTATGAGCAAACTATATCA\n+>haplo3|2\n+GCTACATATTTATTATTTGCTACTTCATAATCACGGGCTCTTACCTTTAAAAAGGGGTCATCGCCTATAGGTTAGATAATCGACACATATAATTATAAGGAATCATTTATAATTTTTAATCTAGTTCATTCTTGTGCATCATTATGTTATATAATAATAAACGTAACAAATATTGATACTACTCATGAGTAGATTTAAGGTGATTTTATAAAATATAAATAATGTATTACGGCTAATTCTATAATCATTATTAATTTTATATATAAATTTAGACTATGGAATTACTAATCACAATAACAGGATCTTGTTATTTTTAGCTTGTGTACTTATATTGATCCGATGTACTTAATTCACAGCTCCTCATTTATTGTGGTATATTTATAACTACGTTTTTAGATAATATGTAAAAATTCTTAATAAAAAAATATATTATGTAAAAAAATAACAAGAGTTAATTAATGTTATTTGACAGGATTTACATAAAATAATCTTTATGGAATGGTGTTTATTGACTCTAAAAATTATATAATATTTTATTTATTGAACTCCTCTTTTAAAAACCATGAAATAGACACCCCTCATTTATATATAATATTATAAAATATTTTATATTAAACTATTAACATATTTTGGTCAACTAATAACATCGTAATATATCTATAATGTATACTATTAATCAAATTCTTCAATAAGTTAATATTTGAGAAATATAAGTGGATGATGTTAATTATAAAATCAATATATCGGAAAAGAGAAATACTTAGTAATGATAAATAAACTGCGAATACTCAATATTATATATAATTAAAATATTTTAATCTAAATATGTTTTTTGATCTATTTTTTTTATATATACATATCATATATAAAATTGTAACAATAGAAACATAAAAGACTATTAAAATAATATAATAATATAAAATTATATAAAATCACATAGATTATGATTAACTGAAAGCCTAATTTATTTTCTATACAGATTAGTGTAAAAGACCATATTAACAATATAAATATTTTATCGGTAGCTAAATCGTATCTATTCCTTTATTAATATATTTATAAGAAAAATATATTCGAATCGAGTTTACTACAAAAGAATATAATATTGTGGAAAATGAGGTTTTCATATTCTTGATATAATAGTCATACATTTTTTGTTCATTATTATTAATAATATATATATTGTCTCTTTGAGACTTTTAGATATTTAATGGGTATATACGATAACTTTAAATTAGTTGATAACAAAAATTAAGTCAGAATATATTATTATATCATGATATTTCAAATCGATTATGAGCTAACGAAATCT\n+>hap'..b'ATTACTGTATTTTTTTTGGCGTTAAATTTATTTATTAAATAATCTTATAATGGTAAATATATAATATTTAAATTTTTATAAATAAAAAAATAAATTATCATCGTTTAATATATTAAATTTATAATAAATTACTATTAAAATACATATATTTTATTTACAATTAATAATAATTATATATTTTATTATATTAAATAATTAATTTTAAATCGAATATAATTGTAATTTAGT\n+>haplo165|2\n+TTACAATCAAAATTAGTACTATAGGAAATGATTAATTCTATTCAAACTATTTTACTAGTATAAAATTAAATACCGGCCAATATATTAGGAGAGACTTGATTTTTTTTAGAATATAGTCTTATGAAGAAAACATTAAGGATATCGAACTAATCGTAATAAGATACGTTATAAAAAACAAATCCATAAATAATAAGTATATTGGAAGAATTATAGTAAATATATTATTACTACTTAAGTAATTTTTTTGTATTAAATTAAATGAAATAAAATATTTTATCTATGAGTTTGAGTCTCTTTACATGTAACTAGTCTATAAATTATTATAATAATTAATAAATTTTAAATTCTATAAAATTTTTCTGTACGAAAAAATTTATAAATATTTTATTATATAAATATAATATGAATTAATATTAATAAATTTAATTAGTCTTCAATAGTTAATTCCTATAAAATGTGTACATACTGAAATTTCTAGGGCTGTACTGTCTACTAGATTAGAATGTTATTATATATAAATTTGTAAGCATTTAATTTACTACATGTTGTCTGATAAAATATAGTATTAAATAATAAATGATATGGTTTTTAATTAAAAATTTTAAAGAACTACATAGTATTGATAAAAATTTGAAAATTTCTCGATTACAACTATTATAATTAACTTAAGTCTGAATTACAGGAATATTTTAGCTTGAAGGCAACGCAATAATAGTTATTTATTTTTTGGTTTCATTGAATTCCAGTATTTAACTCGTTTCATATCTGCAAAGATACTTATTCGTAGATATAAGAATAAATATAGTTTATAATTCTAAATATTATTGCCTTGAATTAATTTAATTACAACTTTCACATATGAGCTATTAAGACTTAAAATGGACTATGATACTAGAGTTGTGTAAACACTAGTAAACATTAAAGAGATTATGAAAGATAATTAAACTACTTTAGAATAGCTTTTATTATATACAGTTAAATACTGAAACTCATTATTATTTTAATAGTTGTATCGAGTAATTAGTCACTATAATGTATATAGAAATAGACATGATATTATAAGAATTAAAATAATAAAATAAGTGATAGTGAAATATTAATTGATAAATAAAGAGATTTATTACATAATAAAAAGCTATCAAATCCATATCATACTATTATACTTAATTAATTTTATATGTATATGAAAGCTATACTATCAATCATAATATTAAAATATTTATTATGATATATAATATTGTATACTTATTTAGTTTAATATATATTATAACGTATAAATAATTACATCATAAATACGATTTAAGATTTAATATATAATATTAGAATATATATAGGAAATACAAGCTGATTAACTTTTTCATACAAATTTATATATTTATGATGTTTTTCATATCATTTTATATATAGACGGAAATATATTATATTTATATTTTTATATCATACAAATACTTTAGTGATACTTATAAGGTTTGTATGATCTAGATAAAATATTTATTTTTTATTACTTAGTGCGATGATTATCCTTGTTTAGTGTTATGAGACAAATAGTATTTTTATATATTTAGAACATGCGTACTAACATTACTAAATATTAATTGCTATTTCTCTTTAAAAGATAATAAATTTTTTTAATATTAAAATAGTTACTGAATTTTTTTTGGCGATAAATTTATTTATTAAATAATCTTATAATGAATTTAAATCTATAAAATTTATAATTATTAAAATAAAATAAATTATCTTCGAATTTATTAATTATAAATAAAAAATAATCATTATTATATTTATATATAATAAAATAATTAATATTTATTATTTAAAAATTTATTTTAAATAATTAATTTTATATCGAATAAAATTGTAATTAAAT\n+>haplo166|2\n+AAACGCATATATTAAGTCAAACTACATAATCCATGCCCTATACATACTATACTCTATCTATAAAATTAAATACTGGCCAATATATTAGAAGAGACTTGATTTTTTTTAGAATAGAGTCTTATGAAGAAAACATTAAGGATATCAATATATTAAAAAATATATACATCATTAATTTCATATAATATAATAATAATATATATAGTAATATAATAGTAAATATATTATTACTACTTATGTAATTTAAATAAGTATTTAATTAAGAATCTTAAATATAATTCCAGAAAAAAGAATCTCTATGCATGTTAGTAGTATATATTAATTAAAAATCAAAATATTATTTTAATTATTATTTTATTTTTCTGTACGAAAAAATTTAAAATATTAAATAATAGAATATATTAAAAATTAATTTAAATATAAATTTATATAGTCTTCAATAGTTAATTCCTATAAAATGTGTACATACTGAAATTTCTAGGGCTGTACTGTCTACTAGATTAGAATGTTATTATATATAAATTTGTAAGCATTTAATTTACTACATGTTGTCTGATAAAATATAGTATTAAATAATAAATGATATGGTTTTTAATTAAAAATTTTAAAGAATTACATTCTATCGATAAAAATTTGAAAATTTCTCGATTACAACTATTATTATTAACTTAAGTCTGAATTACAGGAATATTTTAGCTTGAAGGCAACGCAATAATAGTTATTTATTTTTTGGTTTCATTGAATTCCAGTATTTAACTCGTTTCATATCTGCAAAGATACTTATTCGTAGATATAAGAATAAATATAGATTATAATTCTAAATATTATTGCCTTGAATTAATTTAATTACAACTTTCACATATGAGCTATTAAGACTTAAAATGGACTATGATACTAGAGTTGTGTAAACACTAGTAAACATTAAAGAGTTCTTGAATGATAATATTAAGATTTATGAATAGCTTTTATTATATACAGTTAAATACTGAAACTCATTATTATTTTAATAGTTGTATCGAGTAATTAGTCACTATAATGTATATAGAAATAAGTATTATATTATAAGAATTAAAATATTAATTAAGGTGATAGTGAAATATTAATTGATAAATTAAAAGATTTATTACATAATAAAAAGCTATCAATTCCATATCATACTATTATACTTAATTAATTTTATATGTAAATTTAAGCTATACTATCAATCATAATATTAAAGGTAAAAATTTGTATATATTAATAATATACTTATTTTGTTAAAAATATATTATTTCTTATAAATAATTACATTTAATTATCGATATAAGATTTATATATATTATATTGTGTTATAAATGCTAATACAAGCTGATTAACTTATATTTAATTTAAATATATAACTAGATGTTTTTCGTATCATTTAATATTATGGTGGAATAATATTATATTTAATAAATAATTTCATACTTTTACAACAAAGATATATATATGGAATGTATGATCATCTATTAATATTTATTTATTCTTACTAAAAGAGATCACATACCATCTTATGTACTCTGAGGCAAATTGAAATATAATATATTTAGAACATACGTACTAACATTACTATATATTAATTGCTATTTCTCTTTAAAAGAAATTTTTTAAATAATATTAATTTTGCATTACTGTATTTTTTTTGGCGATAAATTTATTTATTAAATAATCTTAAAATGAATTTAAATCTTAAATATTTAAATTATATATATAAAAATAAAAAATCATCGTTTAATAATATAAATTTATAGATATAATCATTATTATATTTATATATAATAAAATAATTATAATTTATTATTTAAAAATTTATATTAAATAATTAATTTTATATCGAATAAAATTGTAATTAAAT\n' |