roary_plots: Roary/t/Bio/Roary/CommandLine/Roary.t annotate

annotate Roary/t/Bio/Roary/CommandLine/Roary.t @ 0:c47a5f61bc9f draft

Uploaded

author	dereeper
date	Fri, 14 May 2021 20:27:06 +0000
parents
children

rev	line source
0 c47a5f61bc9f Uploaded dereeper parents: diff changeset	1 #!/usr/bin/env perl
c47a5f61bc9f Uploaded dereeper parents: diff changeset	2 use Moose;
c47a5f61bc9f Uploaded dereeper parents: diff changeset	3 use Data::Dumper;
c47a5f61bc9f Uploaded dereeper parents: diff changeset	4 use File::Path qw( remove_tree);
c47a5f61bc9f Uploaded dereeper parents: diff changeset	5 use File::Which;
c47a5f61bc9f Uploaded dereeper parents: diff changeset	6 use File::Path qw(make_path);
c47a5f61bc9f Uploaded dereeper parents: diff changeset	7 use Cwd qw(abs_path getcwd);
c47a5f61bc9f Uploaded dereeper parents: diff changeset	8 use File::Find::Rule;
c47a5f61bc9f Uploaded dereeper parents: diff changeset	9
c47a5f61bc9f Uploaded dereeper parents: diff changeset	10 #Test changes current working directory so relative paths can get out of sync
c47a5f61bc9f Uploaded dereeper parents: diff changeset	11 local $ENV{PERL5LIB} = join(':', ("$ENV{PERL5LIB}", abs_path('./lib'), abs_path('./t/lib')));
c47a5f61bc9f Uploaded dereeper parents: diff changeset	12 local $ENV{PATH} = join(':', ("$ENV{PATH}", abs_path('./bin')));
c47a5f61bc9f Uploaded dereeper parents: diff changeset	13
c47a5f61bc9f Uploaded dereeper parents: diff changeset	14 BEGIN { unshift( @INC, abs_path('./lib') ) }
c47a5f61bc9f Uploaded dereeper parents: diff changeset	15 BEGIN { unshift( @INC, abs_path('./t/lib') ) }
c47a5f61bc9f Uploaded dereeper parents: diff changeset	16 with 'TestHelper';
c47a5f61bc9f Uploaded dereeper parents: diff changeset	17
c47a5f61bc9f Uploaded dereeper parents: diff changeset	18 BEGIN {
c47a5f61bc9f Uploaded dereeper parents: diff changeset	19 use Test::Most;
c47a5f61bc9f Uploaded dereeper parents: diff changeset	20 use_ok('Bio::Roary::CommandLine::Roary');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	21 use_ok('Bio::Roary::CommandLine::CreatePanGenome');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	22 use Bio::Roary::SequenceLengths;
c47a5f61bc9f Uploaded dereeper parents: diff changeset	23 }
c47a5f61bc9f Uploaded dereeper parents: diff changeset	24 my $script_name = 'Bio::Roary::CommandLine::Roary';
c47a5f61bc9f Uploaded dereeper parents: diff changeset	25 my $cwd = getcwd();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	26
c47a5f61bc9f Uploaded dereeper parents: diff changeset	27 local $ENV{PATH} = "$ENV{PATH}:./bin";
c47a5f61bc9f Uploaded dereeper parents: diff changeset	28 my %scripts_and_expected_files;
c47a5f61bc9f Uploaded dereeper parents: diff changeset	29 system('touch empty_file');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	30 cleanup_files();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	31
c47a5f61bc9f Uploaded dereeper parents: diff changeset	32 %scripts_and_expected_files = (
c47a5f61bc9f Uploaded dereeper parents: diff changeset	33 ' -j Parallel --dont_split_groups t/data/query_1.gff t/data/query_2.gff t/data/query_5.gff ' =>
c47a5f61bc9f Uploaded dereeper parents: diff changeset	34 [ 'gene_presence_absence.csv', 't/data/overall_gene_presence_absence.csv' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	35 ' -j Local -t 1 --dont_split_groups t/data/genbank_gbff/genbank1.gff t/data/genbank_gbff/genbank2.gff t/data/genbank_gbff/genbank3.gff' =>
c47a5f61bc9f Uploaded dereeper parents: diff changeset	36 [ 'gene_presence_absence.csv', 't/data/genbank_gbff/genbank_gene_presence_absence.csv' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	37 '-h' => [ 'empty_file', 't/data/empty_file' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	38 );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	39
c47a5f61bc9f Uploaded dereeper parents: diff changeset	40 mock_execute_script_and_check_output_sorted( $script_name, \%scripts_and_expected_files, [ 0, 6, 7, 8, 9 ] );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	41
c47a5f61bc9f Uploaded dereeper parents: diff changeset	42 cleanup_files();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	43
c47a5f61bc9f Uploaded dereeper parents: diff changeset	44 stderr_should_have($script_name,'-a', 'Looking for');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	45
c47a5f61bc9f Uploaded dereeper parents: diff changeset	46 my $current_cwd = getcwd();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	47 stderr_should_have($script_name,'-v --output_directory t/data/directory_which_doesnt_exist t/data/query_1.gff t/data/query_2.gff t/data/query_5.gff', 'Output directory created');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	48 ok( ( -e 't/data/directory_which_doesnt_exist/clustered_proteins' ), 'pan genome files should be in directory' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	49 is(getcwd(),$current_cwd , 'current working directory should not have changed after script is finished');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	50
c47a5f61bc9f Uploaded dereeper parents: diff changeset	51 SKIP:
c47a5f61bc9f Uploaded dereeper parents: diff changeset	52 {
c47a5f61bc9f Uploaded dereeper parents: diff changeset	53 skip "prank not installed", 11 unless ( which('prank') );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	54
c47a5f61bc9f Uploaded dereeper parents: diff changeset	55 %scripts_and_expected_files =
c47a5f61bc9f Uploaded dereeper parents: diff changeset	56 ( '-j Local --dont_delete_files --dont_split_groups --output_multifasta_files t/data/real_data_1.gff t/data/real_data_2.gff' =>
c47a5f61bc9f Uploaded dereeper parents: diff changeset	57 [ 'pan_genome_sequences/mdoH.fa.aln', 't/data/mdoH.fa.aln' ], );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	58 mock_execute_script_and_check_output( $script_name, \%scripts_and_expected_files );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	59
c47a5f61bc9f Uploaded dereeper parents: diff changeset	60 ok( -e 'core_gene_alignment.aln', 'Core gene alignment exists' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	61
c47a5f61bc9f Uploaded dereeper parents: diff changeset	62 ok(
c47a5f61bc9f Uploaded dereeper parents: diff changeset	63 my $seq_len = Bio::Roary::SequenceLengths->new(
c47a5f61bc9f Uploaded dereeper parents: diff changeset	64 fasta_file => 'core_gene_alignment.aln',
c47a5f61bc9f Uploaded dereeper parents: diff changeset	65 ),
c47a5f61bc9f Uploaded dereeper parents: diff changeset	66 'Check size of the core_gene_alignment.aln init'
c47a5f61bc9f Uploaded dereeper parents: diff changeset	67 );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	68
c47a5f61bc9f Uploaded dereeper parents: diff changeset	69 my @keys = keys %{ $seq_len->sequence_lengths };
c47a5f61bc9f Uploaded dereeper parents: diff changeset	70 is( $seq_len->sequence_lengths->{ $keys[0] }, 64983, 'length of first sequence' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	71
c47a5f61bc9f Uploaded dereeper parents: diff changeset	72 ok( -e 'core_alignment_header.embl', 'Core gene alignment header exists' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	73
c47a5f61bc9f Uploaded dereeper parents: diff changeset	74 ok( -e 'accessory.tab' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	75 ok( -e 'core_accessory.tab' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	76 ok( -e 'number_of_conserved_genes.Rtab' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	77 ok( -e 'number_of_genes_in_pan_genome.Rtab' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	78 ok( -e 'number_of_new_genes.Rtab' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	79 ok( -e 'number_of_unique_genes.Rtab' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	80 ok( -e 'blast_identity_frequency.Rtab' );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	81
c47a5f61bc9f Uploaded dereeper parents: diff changeset	82 cleanup_files();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	83 %scripts_and_expected_files =
c47a5f61bc9f Uploaded dereeper parents: diff changeset	84 (
c47a5f61bc9f Uploaded dereeper parents: diff changeset	85 '-j Local --output_multifasta_files t/data/core_alignment_gene_lookup/query_1.gff t/data/core_alignment_gene_lookup/query_2.gff t/data/core_alignment_gene_lookup/query_3.gff'
c47a5f61bc9f Uploaded dereeper parents: diff changeset	86 => [ 'core_gene_alignment.aln', 't/data/core_alignment_gene_lookup/expected_core_gene_alignment.aln' ], );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	87 mock_execute_script_and_check_output( $script_name, \%scripts_and_expected_files );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	88
c47a5f61bc9f Uploaded dereeper parents: diff changeset	89 cleanup_files();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	90 }
c47a5f61bc9f Uploaded dereeper parents: diff changeset	91
c47a5f61bc9f Uploaded dereeper parents: diff changeset	92 SKIP:
c47a5f61bc9f Uploaded dereeper parents: diff changeset	93 {
c47a5f61bc9f Uploaded dereeper parents: diff changeset	94 skip "extended tests not run", 40 unless ( defined($ENV{ROARY_FULL_TESTS}));
c47a5f61bc9f Uploaded dereeper parents: diff changeset	95
c47a5f61bc9f Uploaded dereeper parents: diff changeset	96 %scripts_and_expected_files = (
c47a5f61bc9f Uploaded dereeper parents: diff changeset	97 '-o some_different_output -i 90 -p 2 --translation_table 1 t/data/real_data_1.gff t/data/real_data_2.gff' => [ 'some_different_output', 't/data/expected_some_different_output' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	98 );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	99 mock_execute_script_and_check_output_sorted( $script_name, \%scripts_and_expected_files, [ 0 ] );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	100
c47a5f61bc9f Uploaded dereeper parents: diff changeset	101 stderr_should_have($script_name,'--translation_table 1 -o some_different_output --core_definition 60 -p 2 -e --mafft --group_limit 10 t/data/real_data_1.gff t/data/real_data_2.gff', 'Exiting early because number of clusters is too high');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	102 stderr_should_have($script_name,'--verbose_stats --group_limit 10 -e t/data/query_1.gff t/data/query_2.gff t/data/query_5.gff', 'Exiting early because number of clusters is too high');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	103 stderr_should_not_have($script_name,'-e --group_limit 10 t/data/query_1.gff t/data/query_2.gff t/data/query_5.gff ', 'Cant access the multifasta base directory');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	104 stderr_should_have($script_name,'-i 90 --core_definition 60 -p 2 -v t/data/real_data_1.gff t/data/real_data_2.gff ','Cleaning up files');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	105 stderr_should_have($script_name,'-i 30 t/data/query_1.gff t/data/query_2.gff t/data/query_5.gff','The percentage identity is too low');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	106 stderr_should_not_have($script_name,'--dont_delete_files -v t/data/query_1.gff t/data/query_2.gff t/data/query_5.gff ','Cleaning up files');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	107 stderr_should_have($script_name,'-v --group_limit 100000 -e t/data/query_1.gff t/data/query_2.gff t/data/query_5.gff ' ,'Running command: pan_genome_core_alignment');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	108 stderr_should_have($script_name,'--translation_table 1 -v t/data/real_data_1.gff t/data/real_data_2.gff ' ,'Cleaning up files');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	109 stderr_should_have($script_name,'-e -v t/data/real_data_1.gff t/data/real_data_2.gff ','Creating files with the nucleotide sequences for every cluster');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	110
c47a5f61bc9f Uploaded dereeper parents: diff changeset	111 SKIP:
c47a5f61bc9f Uploaded dereeper parents: diff changeset	112 {
c47a5f61bc9f Uploaded dereeper parents: diff changeset	113 skip "kraken not installed", 2 unless ( which('kraken') );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	114 skip "kraken-report not installed", 2 unless ( which('kraken-report') );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	115 stderr_should_have($script_name,'-v --qc t/data/real_data_1.gff t/data/real_data_2.gff' ,'Running Kraken on each input assembly');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	116 }
c47a5f61bc9f Uploaded dereeper parents: diff changeset	117
c47a5f61bc9f Uploaded dereeper parents: diff changeset	118 %scripts_and_expected_files = (
c47a5f61bc9f Uploaded dereeper parents: diff changeset	119 # output
c47a5f61bc9f Uploaded dereeper parents: diff changeset	120 '-o some_different_output -e --dont_delete_files t/data/real_data_1.gff t/data/real_data_2.gff' =>
c47a5f61bc9f Uploaded dereeper parents: diff changeset	121 [ 'pan_genome_sequences/mdoH.fa.aln', 't/data/mdoH.fa.aln' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	122 '-o some_different_output --core_definition 60 t/data/real_data_1.gff t/data/real_data_2.gff' =>
c47a5f61bc9f Uploaded dereeper parents: diff changeset	123 [ 'summary_statistics.txt', 't/data/expected_core_60_summary_statistics.txt' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	124 '-e -i 95.3 --translation_table 1 -v --group_limit 100000 --qc t/data/real_data_1.gff t/data/real_data_2.gff' => [ 'core_gene_alignment.aln', 't/data/expected_real_data_core_gene_alignment.aln' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	125
c47a5f61bc9f Uploaded dereeper parents: diff changeset	126 '-e --verbose_stats t/data/real_data_1.gff t/data/real_data_2.gff' => [ 'core_gene_alignment.aln', 't/data/expected_real_data_core_gene_alignment.aln' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	127 '--core_definition 60 t/data/real_data_1.gff t/data/real_data_2.gff' => [ 'summary_statistics.txt', 't/data/expected_core_60_summary_statistics.txt' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	128 '-p 2 -e --dont_delete_files t/data/real_data_1.gff t/data/real_data_2.gff' => [ 'pan_genome_sequences/mdoH.fa.aln', 't/data/mdoH.fa.aln' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	129 '-p 2 --core_definition 60 t/data/real_data_1.gff t/data/real_data_2.gff' => [ 'summary_statistics.txt', 't/data/expected_core_60_summary_statistics.txt' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	130 '-p 2 -e --mafft t/data/real_data_1.gff t/data/real_data_2.gff' => [ 'core_gene_alignment.aln', 't/data/expected_mafft_real_data_core_gene_alignment.aln' ],
c47a5f61bc9f Uploaded dereeper parents: diff changeset	131
c47a5f61bc9f Uploaded dereeper parents: diff changeset	132 );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	133 mock_execute_script_and_check_output_sorted( $script_name, \%scripts_and_expected_files );
c47a5f61bc9f Uploaded dereeper parents: diff changeset	134
c47a5f61bc9f Uploaded dereeper parents: diff changeset	135 }
c47a5f61bc9f Uploaded dereeper parents: diff changeset	136
c47a5f61bc9f Uploaded dereeper parents: diff changeset	137 cleanup_files();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	138
c47a5f61bc9f Uploaded dereeper parents: diff changeset	139 done_testing();
c47a5f61bc9f Uploaded dereeper parents: diff changeset	140
c47a5f61bc9f Uploaded dereeper parents: diff changeset	141 sub cleanup_files {
c47a5f61bc9f Uploaded dereeper parents: diff changeset	142 remove_tree('pan_genome_sequences');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	143 remove_tree('fixed_input_files');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	144 remove_tree('t/data/directory_which_doesnt_exist');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	145 remove_tree('locus_tags_gffs_output');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	146 unlink('_blast_results');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	147 unlink('_clustered');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	148 unlink('_clustered.bak.clstr');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	149 unlink('_clustered.clstr');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	150 unlink('_combined_files');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	151 unlink('_combined_files.groups');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	152 unlink('_fasta_files');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	153 unlink('_gff_files');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	154 unlink('_inflated_mcl_groups');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	155 unlink('_inflated_unsplit_mcl_groups');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	156 unlink('_labeled_mcl_groups');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	157 unlink('_uninflated_mcl_groups');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	158 unlink('accessory.header.embl');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	159 unlink('accessory.header.tab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	160 unlink('accessory.tab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	161 unlink('blast_identity_frequency.Rtab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	162 unlink('clustered_proteins');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	163 unlink('core_accessory.header.embl');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	164 unlink('core_accessory.header.tab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	165 unlink('core_accessory.tab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	166 unlink('core_gene_alignment.aln');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	167 unlink('database_masking.asnb');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	168 unlink('example_1.faa.tmp.filtered.fa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	169 unlink('example_2.faa.tmp.filtered.fa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	170 unlink('example_3.faa.tmp.filtered.fa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	171 unlink('gene_presence_absence.csv');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	172 unlink('number_of_conserved_genes.Rtab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	173 unlink('number_of_genes_in_pan_genome.Rtab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	174 unlink('number_of_new_genes.Rtab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	175 unlink('number_of_unique_genes.Rtab');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	176 unlink('pan_genome.fa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	177 unlink('query_1.gff.proteome.faa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	178 unlink('query_2.gff.proteome.faa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	179 unlink('query_3.gff.proteome.faa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	180 unlink('query_5.gff.proteome.faa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	181 unlink('real_data_1.gff.proteome.faa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	182 unlink('real_data_2.gff.proteome.faa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	183 unlink('pan_genome_reference.fa');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	184 unlink('accessory_graph.dot');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	185 unlink('core_accessory_graph.dot');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	186 unlink('some_different_output');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	187 unlink('core_alignment_header.embl');
c47a5f61bc9f Uploaded dereeper parents: diff changeset	188 }

Mercurial > repos > dereeper > roary_plots

annotate Roary/t/Bio/Roary/CommandLine/Roary.t @ 0:c47a5f61bc9f draft