Repository 'dm1_genotypying'
hg clone https://toolshed.g2.bx.psu.edu/repos/nitrozyna/dm1_genotypying

Changeset 4:d3dbf9e8a0e2 (2018-01-16)
Previous changeset 3:a1cb5223ac36 (2018-01-16) Next changeset 5:6242a111983d (2018-01-16)
Commit message:
Uploaded
added:
generate_data.py
b
diff -r a1cb5223ac36 -r d3dbf9e8a0e2 generate_data.py
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/generate_data.py Tue Jan 16 15:15:20 2018 -0500
[
@@ -0,0 +1,24 @@
+from __future__ import print_function
+import math
+import random
+# that's our x data, i.e. reference
+x = range(1, 101)
+
+# generate a gaussian
+def gaussian(x, amp, cen, wid):
+    return amp * math.exp(-(x - cen) ** 2 / wid)
+
+read1 = 18
+read2 = 66
+
+# that's our y data, i.e. reads
+y = [int(round(gaussian(i, 20000, read1, 0.5) + gaussian(i, 20000, read2, 0.5) + random.gauss(200, 90))) for i in x]
+
+# that's our data printed in pairs (x_i, y_i)
+with open("input.txt", "w") as f:
+    for pair in zip(x, y):
+        for p in pair:
+            print(p, end="\t", file=f)
+        print(file=f)
+
+# you have to set this manually to weed out all the noise. Every bit of noise should be below it.