0
|
1 #:t:::::::::::::::::g@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
2 #:t::::::::::::::;@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
3 #:::::::::::::z;@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
4 #::::::::::::i@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
5 #::::::::::::@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@$@@@@
|
|
6 #:::::::::::3@@@@@@@@@@@@@@@@@@@@@@@@@B@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
7 #::::::::::3@@@@@@@@@@@@@@@@@@@@@BEEESSE5EEEEBBM@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
8 #::::::::::3@@@@@@@@@@@@@@@@@@@@BEEEEEE35EE55E2355E5SBMB@@@@@@@@@@@@@@@@@$
|
|
9 #::::::::::@@@@@@@@@@@@@@@@@@@EEEE55533t3tttt::::::!!!!7755E755SBBMMM@@@MM
|
|
10 #::::::::::3@@@@@@@@@@@@@@@@@@EEEE2t3ttttt:::::::::::::::::::::::!7?5225EE
|
|
11 #::::::::::3@@@@@@@@@@@@@@@@@@EEEEE31t::::::::::::::::::::::::::::::::3E5@
|
|
12 #::::::::::3@@@@@@@@@@@@@@@@@@EEEEEEtt:::::::::::::::::::::::::::::::::353
|
|
13 #::::::::::3@@@@@@@@@@@@@@@@@@EEEEEE1ttz::::::::::::::::::::::::::::::::35
|
|
14 #:::::::::::@@@@@@@@@@@@@@@@@@EEEEEEEtz1::::::::::::::::::::::::::::::::t:
|
|
15 #:::::::::!3@@@@@@@@@@@@@@@@@@@EEEEEttt::::::::::::::::::::::::::::::::;zz
|
|
16 #::::::::::@@@@@@@@@@@@@@@@@@@@EEEEEttt:::::z;z:::::::::::::::::::::::::13
|
|
17 #::::::::::3B@@@@@@@@@@@@@@@@@@EEEEEEE3tt:czzztti;:::::::::::::::::::::::3
|
|
18 #::::ttt::::3@@@@@@@@@@@@@@@@EEEEE5EE25Ezt1EEEz5Etzzz;;;;:::::::::::::::::
|
|
19 #:::::::::::I9@@@@@@@@@@@@@@@@@@@@@@@@@@EEEEEE@@@@@@@@@@@@@@Ez;:::::::::::
|
|
20 #:::::::::::::E@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@Ez::::::
|
|
21 #::::::::::::::E@@@@@@@@@@@@@@@@@@@@@@@@@@@@@BE5EBB@@@@@@@@@@@@@@@EEE:::::
|
|
22 #:::::::::::::::@@@@@@@@@@@@@@@@@@@@@@@@@@@@E1::35@@@@@@@@@@ME3MMME2::::::
|
|
23 #:::::::::::::::?@@@@@@@@@@@@@@@@@@M@@@@@@@EE:::::3SB@@BBESEEt::::::::::::
|
|
24 #::::::::::::::::J$@@@@@@@B@@@@@@@@@@@@@@@@EE:::::::!35E33t:::::::::::::::
|
|
25 #:::::::::::::::::3@E@@@EE5EESE5EESE@@@@@@@Et::::::::::::tz:::::::::::::::
|
|
26 #:::::::::::::::::J@E$@EEE5133555SE@@@@@@@@Et:::::::::::::::::::::::::::::
|
|
27 #::::::::::::::::::E@E@EEEEtt3523EEE@@@@@@@E::::::::::::::::::::::::::::::
|
|
28 #:t::::::::::::::::JEE3@@@EEEEEEEEEE@@@@@@@E:::::::::t;:::::::::::::::::::
|
|
29 #:t:::::::::::::::::!5ES@EEEEEEEEES@@@@@@@@@E;:::;;;:3Ez::::::::::::::::::
|
|
30 #:t::::::::::::::::::::JE@@EEEEEEE@@@@@@@@@@@@@@@@ME!:::;:::::::::::::::::
|
|
31 #:tz::::::::::::::::::::JE@@@EEEE@@@@@@@@@@@@@@EE!:::::::t::::::::::::::::
|
|
32 #:t::::::::::::::::::::::3@@@@@@@@@@@@@@@@@@ESBE::::::::::::::::::::::::::
|
|
33 #:::::::::::::::::::::::::Q@@@@@@@@@@@@@@@@EE3EE;:::::zzzz::::::::::::::::
|
|
34 #:::::::::::::::::::::::::3@@@@@@@@@@@@@@@@@@@@@@NN@@@@@@Ez:::::::::::::::
|
|
35 #:zt:::::::::::::::::::::::3@@@@EE@@@@@@@@@@EEEEt::;z113E5t:::::::::::::::
|
|
36 #::tt:::::::::::::::::::::::3@@@E@@@@@@@@@@@@@@@@BEt::::::::::::::::t:::::
|
|
37 #:tt:t:::::::::::::::::::::::?S@@@@@@@@@@@BBEEE51!::::::::::::::zzzEt:::::
|
|
38 #::::::::::::::::::::::::::::::3Q@@@@@@@BEEEEEt:::::::::::::;zz@@@EE::::::
|
|
39 #::::::::::::::::::::::::::::::::75B@@@@@EEEtt;:::::::::;zz@@@@BEEEtz:::::
|
|
40 #::::::::::::::::::::::::::::::::::::?9@@@@@@@@@@@E2Ezg@@@@@B@@@EEEE1t::::
|
|
41 #:::::::::::::::::::::::::::::::::::::::3@@@@@@@@@@@@@@@@@@@E@EEEEEEEzzz::
|
|
42 #::::::::::::::::::::::::::::::::::::;@@@@@@@@@@@@@@@@@@@@@@@EEEEEEE5ttttt
|
|
43 #:::::::::::::::::::::::::::::::;g@@@@@@@@@@@@@@@@@@@@@@@@@@EEEEEEEEEEEtzt
|
|
44 #::::::::::::::::::::::::::::;@@@@@@@@@@@@@@@@@@@@@@@@@@E@@EEEEEEEEEEEE@@@
|
|
45 #::::::::::::::::::::::::::g@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@EEEE3EEEE@@@@@@@
|
|
46 #:::::::::::::::::::::;;g@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@EEEt33@@@@@@@@@@
|
|
47 #:::::::::::::::::;g@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@E@@@@@@EEEtg@@@@@@@@@@@@
|
|
48 #::::::::::::::;@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@EEEE@@@@@@@@@@@@@@@@@@@@@@@@
|
|
49 #:::::::::::::@@@@@@@@@@@@@@@@@$@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
50 #::::::::::;@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@@
|
|
51 #
|
|
52 # Copyleft ↄ⃝ 2012 Institut Curie
|
|
53 # Author(s): Valentina Boeva, Alban Lermine (Institut Curie) 2012
|
|
54 # Contact: valentina.boeva@curie.fr, alban.lermine@curie.fr
|
|
55 # This software is distributed under the terms of the GNU General
|
|
56 # Public License, either Version 2, June 1991 or Version 3, June 2007
|
|
57
|
|
58 #!/usr/bin/perl -w
|
|
59 use strict;
|
|
60
|
|
61 #creats a BED file with central area of peaks
|
|
62
|
|
63
|
|
64 my $usage = qq{
|
|
65 $0
|
|
66
|
|
67 -----------------------------
|
|
68 mandatory parameters:
|
|
69
|
|
70 -f filename file with sites in BED format
|
|
71 -l value length of the cental regions
|
|
72
|
|
73 -----------------------------
|
|
74 optional parameters:
|
|
75 -v for verbose
|
|
76 -head 1/0 if there is a header
|
|
77 -o filename output file
|
|
78 };
|
|
79
|
|
80 if(scalar(@ARGV) <2){
|
|
81 print $usage;
|
|
82 exit(0);
|
|
83 }
|
|
84
|
|
85 my $flank = 0;
|
|
86 my $ResFilename = "";
|
|
87 my $file = "";
|
|
88 my $header = 0;
|
|
89 my $verbose = 0;
|
|
90
|
|
91 while(scalar(@ARGV) > 0){
|
|
92 my $this_arg = shift @ARGV;
|
|
93 if ( $this_arg eq '-h') {print "$usage\n"; exit; }
|
|
94 elsif ( $this_arg eq '-f') {$file = shift @ARGV;}
|
|
95 elsif ( $this_arg eq '-v') {$verbose = 1;}
|
|
96 elsif ( $this_arg eq '-head') {$header = shift @ARGV;}
|
|
97 elsif ( $this_arg eq '-o') {$ResFilename = shift @ARGV;}
|
|
98 elsif ( $this_arg eq '-l') {$flank = shift @ARGV;$flank /=2;}
|
|
99 elsif ( $this_arg =~ m/^-/ ) { print "unknown flag: $this_arg\n";}
|
|
100 }
|
|
101
|
|
102
|
|
103
|
|
104
|
|
105 my $count = 0;
|
|
106 my %hash;
|
|
107
|
|
108 open (FILE, "<$file") or die "Cannot open file $file!!!!: $!";
|
|
109 open (OUT, ">$ResFilename") or die "Cannot open file $ResFilename!!!!: $!";
|
|
110
|
|
111 if ($header) {
|
|
112 <FILE>;
|
|
113 }
|
|
114
|
|
115 while (<FILE>) {
|
|
116 chomp;
|
|
117 next if (/^#/);
|
|
118 next if (/track/);
|
|
119 my @a = split /\s/;
|
|
120 my $chr = $a[0];
|
|
121 my $maxPos = $a[3];
|
|
122 my $score = $a[4];
|
|
123 if ($maxPos=~/\D/) {
|
|
124 $maxPos = int(($a[1]+$a[2])/2);
|
|
125 } elsif ($maxPos < $a[1]){ #MACS intervals
|
|
126 $maxPos = $a[1]+$a[4];
|
|
127 $score = $a[5];
|
|
128 }
|
|
129 my $firstPos = $maxPos-$flank;
|
|
130 my $lastPos = $maxPos+$flank;
|
|
131
|
|
132 my $ID=$chr.":".$firstPos."_".$lastPos."_".$score ;
|
|
133 unless (exists($hash{$ID})) {
|
|
134 $hash{$ID}=1;
|
|
135 $count++;
|
|
136 print OUT "$chr\t$firstPos\t$lastPos\t$score\n";
|
|
137 }
|
|
138 }
|
|
139
|
|
140 #print "$file\t$count\n";
|
|
141 close FILE;
|
|
142 close OUT;
|
|
143
|