Repository 'gprofiler_orth'
hg clone https://toolshed.g2.bx.psu.edu/repos/iuc/gprofiler_orth

Changeset 0:89cf0828d89d (2019-11-14)
Next changeset 1:727e7e114f9d (2019-11-18)
Commit message:
"planemo upload for repository https://github.com/galaxyproject/tools-iuc/tree/master/tools/gprofiler/ commit ed9b518a6aaf6a5aada47e39c039f6936e41b290"
added:
README
gprofiler_orth.xml
macros.xml
test-data/example_convert_results.txt
test-data/example_convert_results_2.txt
test-data/example_gost_results.txt
test-data/example_gost_results_2.txt
test-data/example_gost_results_3.txt
test-data/example_orth_results.txt
test-data/example_orth_results_2.txt
test-data/example_query.txt
test-data/example_query_2.txt
test-data/example_snpense_query.txt
test-data/example_snpense_results.txt
test-data/example_snpense_results_2.txt
b
diff -r 000000000000 -r 89cf0828d89d README
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/README Thu Nov 14 06:00:14 2019 -0500
b
@@ -0,0 +1,52 @@
+Galaxy wrapper for gprofiler2
+=========================
+
+g:Profiler is a widely used toolset for finding biological categories enriched in gene lists, conversions between gene identifiers and mappings to their orthologs. Mission of g:Profiler is to provide a reliable service based on up to date high quality data in a convenient manner across many evidence types, identifier spaces and organisms. g:Profiler relies on Ensembl as a primary data source and follows their quarterly release cycle while updating the other data sources simultaneously. g:Profiler provides modern responsive interactive web interface, standardised API, an R package gprofiler2 and libraries. The results are delivered through interactive and configurable interface. Results can be downloaded as publication ready visualisations or delimited text files. g:Profiler supports close to 500 species and strains, including vertebrates, plants, fungi, insects and parasites. By supporting user uploaded custom GMT files, g:Profiler is capable of analysing data from any organism. All past releases are maintained for reproducibility and transparency. g:Profiler is freely available for all users at https://biit.cs.ut.ee/gprofiler.
+
+Installation
+============
+
+The recommended installation is by means of the toolshed_.
+
+.. _toolshed: http://toolshed.g2.bx.psu.edu/
+
+As HTML content is blocked from display, to render optional Plotly output gProfiler GOSt (gprofiler_gost) should be allowed
+at Admin > Tool Management > Manage whitelist.
+
+
+History
+=======
+
+* v0.1.6+galaxy10 - add custom background support, fix dependencies, add messages to stdout
+* v0.1.6+galaxy9 - add notification, fix tests
+* v0.1.6+galaxy8 - improve formatting
+* v0.1.6+galaxy7 - add random tool, update gprofiler2 version, major refactoring, add tests
+* v0.1.6+galaxy6 - fix tools' names
+* v0.1.6+galaxy5 - remove random tool
+* v0.1.6+galaxy4 - modify commands and names to lowercase
+* v0.1.6+galaxy3 - add r-base to requirements, fixes for suite
+* v0.1.6+galaxy2 - remove r-base from requirements, fixes for Linux
+* v0.1.6+galaxy1 - add r-base to requirements
+* v0.1.6+galaxy0 - initial release
+
+
+Licence (MIT)
+=============
+
+Permission is hereby granted, free of charge, to any person obtaining a copy
+of this software and associated documentation files (the "Software"), to deal
+in the Software without restriction, including without limitation the rights
+to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
+copies of the Software, and to permit persons to whom the Software is
+furnished to do so, subject to the following conditions:
+
+The above copyright notice and this permission notice shall be included in
+all copies or substantial portions of the Software.
+
+THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
+IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
+FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
+AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
+LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
+OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
+THE SOFTWARE.
b
diff -r 000000000000 -r 89cf0828d89d gprofiler_orth.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/gprofiler_orth.xml Thu Nov 14 06:00:14 2019 -0500
[
@@ -0,0 +1,96 @@
+<?xml version="1.0"?>
+<tool id="gprofiler_orth" name="gProfiler Orth" version="@VERSION@">
+    <description>translates gene identifiers between organisms</description>
+    <macros>
+        <import>macros.xml</import>
+    </macros>
+    <expand macro="requirements"></expand>
+    <expand macro="version_command" />
+    <command detect_errors="aggressive">Rscript $script_file</command>
+    <configfiles>
+        <configfile name="script_file"><![CDATA[
+
+options( show.error.messages=F, error = function () { cat( geterrmessage(), file=stderr() ); q( "no", 1, F ) } )
+loc <- Sys.setlocale("LC_MESSAGES", "en_US.UTF-8")
+
+suppressPackageStartupMessages({
+    library("gprofiler2")
+})
+
+set_user_agent(paste(get_user_agent(), "galaxy"))
+sessionInfo()
+
+#if $tool_settings.base_url
+    set_base_url('${tool_settings.base_url}')
+#end if
+
+#if $max
+    mthreshold <- $max
+#else
+    mthreshold = Inf
+#end if
+
+query <- scan('${input.file_name}', character(), quote = "")
+
+response <- gorth( query
+                 , source_organism   = '${source.organism}'
+                 , target_organism     = '${target.organism}'
+                 , numeric_ns = '${numeric_ns}'
+                 , mthreshold = mthreshold
+                 , filter_na  = ${filter_na}
+                 )
+
+output <- response
+output.colnames = colnames(output)
+write.table(output, file='${output}', quote=FALSE, sep='\t', row.names = FALSE, col.names = output.colnames)
+
+        ]]></configfile>
+    </configfiles>
+    <inputs>
+        <expand macro="input" />
+        <expand macro="organism" name="source" label="Source organism" />
+        <expand macro="organism" name="target" label="Target organism" hsapiens_selected="false" mmusculus_selected="true" />
+        <param name="numeric_ns" type="text" value="" optional="true" label="Numeric IDs treated as" help="The prefix for fully numeric IDs. Check the “Resources” section below for the complete list of supported namespaces (including numeric). E.g., ENTREZGENE_ACC, WIKIGENE_ACC." />
+        <param name="max" type="integer" value="" optional="true" label="Maximum number of ortholog names per gene to show" help="Shows all by default." />
+        <expand macro="filter_na" />
+        <expand macro="tool_settings"></expand>
+    </inputs>
+    <outputs>
+        <data label="${tool.name} on ${on_string}" name="output" format="tabular" />
+    </outputs>
+    <tests>
+        <test>
+            <param name="input" ftype="txt" value="example_query.txt" />
+            <param name="base_url" value="http://biit.cs.ut.ee/gprofiler_archive3/e94_eg41_p11" />
+            <output name="output" ftype="tabular" file="example_orth_results.txt" sort="true" />
+        </test>
+        <test>
+            <param name="input" ftype="txt" value="example_query_2.txt" />
+            <param name="base_url" value="http://biit.cs.ut.ee/gprofiler_archive3/e94_eg41_p11" />
+            <conditional name="source">
+                <param name="organism" value="mmusculus" />
+            </conditional>
+            <conditional name="target">
+                <param name="organism" value="hsapiens" />
+            </conditional>
+            <param name="numeric_ns" value="WIKIGENE_ACC" />
+            <param name="max" value="1" />
+            <param name="filter_na" value="T" />
+            <output name="output" ftype="tabular" file="example_orth_results_2.txt" sort="true" />
+        </test>
+    </tests>
+
+    <help><![CDATA[
+
+**What it does**
+  This tool wraps gprofiler2 R package which performs a request to g:Profiler g:Orth tool through its API.
+    g:Profiler g:Orth retrieves the genes of the target organism that are similar in sequence to the source organism
+    genes in the input.
+
+-----
+
+@REFERENCES@
+
+    ]]></help>
+    <expand macro="citations"></expand>
+</tool>
\ No newline at end of file
b
diff -r 000000000000 -r 89cf0828d89d macros.xml
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/macros.xml Thu Nov 14 06:00:14 2019 -0500
[
@@ -0,0 +1,101 @@
+<?xml version="1.0"?>
+<macros>
+    <xml name="requirements">
+        <requirements>
+            <requirement type="package" version="@TOOL_VERSION@">r-gprofiler2</requirement>
+            <requirement type="package" version="2.7.3">pandoc</requirement>
+            <yield />
+        </requirements>
+    </xml>
+
+    <token name="@TOOL_VERSION@">0.1.7</token>
+    <token name="@VERSION@">@TOOL_VERSION@+galaxy10</token>
+
+    <xml name="version_command">
+        <version_command>
+            Rscript -e 'library(gprofiler2); packageVersion("gprofiler2")' | sed 's/\[1\] //' | sed 's/.//;s/.$//'
+        </version_command>
+    </xml>
+
+    <token name="@REFERENCES@"><![CDATA[
+
+This tool is part of the `g:Profiler`_ from the `University of Tartu`_.
+
+  .. _g:Profiler: https://biit.cs.ut.ee/gprofiler/
+  .. _University of Tartu: https://ut.ee/en/
+
+**Resources**
+  * `A complete list of suppоrted organism IDs`_
+  * `A complete list of supported namespaces`_
+
+  .. _A complete list of suppоrted organism IDs: https://biit.cs.ut.ee/gprofiler/page/organism-list
+  .. _A complete list of supported namespaces: https://biit.cs.ut.ee/gprofiler/page/namespaces-list
+
+**gprofiler2 R tool**
+  * https://CRAN.R-project.org/package=gprofiler2 — as CRAN package.
+  * https://anaconda.org/conda-forge/r-gprofiler2 — as conda-forge package.
+
+**Contact**
+  * Contact us at biit.support@ut.ee for further help.
+
+.. class:: warningmark
+
+By default the tool makes requests to APIs of the latest g:Profiler instance with the most recent data release.
+Please, use ’Tool Settings → Base URL’ to modify it in case you want to make use of older data versions. Also, if the
+results should be pinned for reproducibility, we suggest to modify the base url to the last archived data version.
+
+    ]]></token>
+
+    <xml name="input">
+        <param name="input" type="data" format="txt" label="Input is whitespace-separated list of genes, proteins, probes, term IDs or chromosomal regions." />
+    </xml>
+    <xml name="organism" token_name="organism" token_label="Organism"
+         token_hsapiens_selected="true" token_mmusculus_selected="false">
+        <conditional name="@NAME@">
+            <param name="select_input_type" type="select" label="@LABEL@">
+                <option value="select">Common organisms</option>
+                <option value="input">Enter organism ID</option>
+            </param>
+            <when value="select">
+                <param name="organism" type="select" label="Common organisms">
+                    <option value="athaliana">Arabidopsis thaliana</option>
+                    <option value="afumigatusa1163">Aspergillus fumigatus A1163</option>
+                    <option value="btaurus">Bos taurus (Cow)</option>
+                    <option value="celegans">Caenorhabditis elegans</option>
+                    <option value="cfamiliaris">Canis lupus familiaris (Dog)</option>
+                    <option value="drerio">Danio rerio (Zebrafish)</option>
+                    <option value="dmelanogaster">Drosophila melanogaster</option>
+                    <option value="ggallus">Gallus gallus (Chicken)</option>
+                    <option value="hsapiens" selected="@HSAPIENS_SELECTED@">Homo sapiens (Human)</option>
+                    <option value="mmusculus" selected="@MMUSCULUS_SELECTED@">Mus musculus (Mouse)</option>
+                    <option value="osativa">Oryza sativa Japonica Group</option>
+                    <option value="pteres">Pyrenophora teres f. teres 0-1 (Pyrenophora teres)</option>
+                    <option value="rnorvegicus">Rattus norvegicus (Rat)</option>
+                    <option value="scerevisiae">Saccharomyces cerevisiae</option>
+                    <option value="zmays">Zea mays</option>
+                </param>
+            </when>
+            <when value="input">
+                <param name="organism" type="text" value="hsapiens" label="Enter organism ID" help="Organism IDs are constructed by concatenating the first letter of the generic name and the specific name. E.g., human — Homo sapiens — ’hsapiens’, mouse — Mus musculus — ’mmusculus’, thale cress — Arabidopsis thaliana — ’athaliana’. Check the help section below for the complete list of supported organism IDs." />
+            </when>
+        </conditional>
+    </xml>
+
+    <xml name="filter_na">
+        <param name="filter_na" type="boolean" checked="false" truevalue="T" falsevalue="F" label="Filter N/A" help="Whether to filter out results without a corresponding target name." />
+    </xml>
+
+    <xml name="tool_settings">
+        <section name="tool_settings" title="Tool settings" expanded="false">
+            <param type="text" name="base_url" label="Base URL" optional="true" help="Useful for overriding the default URL (http://biit.cs.ut.ee/gprofiler) with the beta (https://biit.cs.ut.ee/gprofiler_beta) or a compatible archived version (available starting from the version e94_eg41_p11, e.g. https://biit.cs.ut.ee/gprofiler_archive3/e94_eg41_p11)." value="http://biit.cs.ut.ee/gprofiler" />
+            <yield />
+        </section>
+    </xml>
+
+    <xml name="citations">
+        <citations>
+            <citation type="doi">doi:10.1093/nar/gkz369</citation>
+            <yield />
+        </citations>
+    </xml>
+</macros>
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_convert_results.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_convert_results.txt Thu Nov 14 06:00:14 2019 -0500
[
@@ -0,0 +1,32 @@
+input_number input target_number target name description namespace
+4 ENSG00000156103 4.1 ENSG00000156103 MMP16 matrix metallopeptidase 16 [Source:HGNC Symbol;Acc:HGNC:7162] ARRAYEXPRESS,ENSG
+3 GO:0005005 3.1 ENSG00000044524 EPHA3 EPH receptor A3 [Source:HGNC Symbol;Acc:HGNC:3387] GO
+3 GO:0005005 3.2 ENSG00000070886 EPHA8 EPH receptor A8 [Source:HGNC Symbol;Acc:HGNC:3391] GO
+3 GO:0005005 3.3 ENSG00000080224 EPHA6 EPH receptor A6 [Source:HGNC Symbol;Acc:HGNC:19296] GO
+3 GO:0005005 3.4 ENSG00000108947 EFNB3 ephrin B3 [Source:HGNC Symbol;Acc:HGNC:3228] GO
+3 GO:0005005 3.5 ENSG00000116106 EPHA4 EPH receptor A4 [Source:HGNC Symbol;Acc:HGNC:3388] GO
+3 GO:0005005 3.6 ENSG00000133216 EPHB2 EPH receptor B2 [Source:HGNC Symbol;Acc:HGNC:3393] GO
+3 GO:0005005 3.7 ENSG00000135333 EPHA7 EPH receptor A7 [Source:HGNC Symbol;Acc:HGNC:3390] GO
+3 GO:0005005 3.8 ENSG00000142627 EPHA2 EPH receptor A2 [Source:HGNC Symbol;Acc:HGNC:3386] GO
+3 GO:0005005 3.9 ENSG00000143590 EFNA3 ephrin A3 [Source:HGNC Symbol;Acc:HGNC:3223] GO
+3 GO:0005005 3.10 ENSG00000145242 EPHA5 EPH receptor A5 [Source:HGNC Symbol;Acc:HGNC:3389] GO
+3 GO:0005005 3.11 ENSG00000146904 EPHA1 EPH receptor A1 [Source:HGNC Symbol;Acc:HGNC:3385] GO
+3 GO:0005005 3.12 ENSG00000154928 EPHB1 EPH receptor B1 [Source:HGNC Symbol;Acc:HGNC:3392] GO
+3 GO:0005005 3.13 ENSG00000182580 EPHB3 EPH receptor B3 [Source:HGNC Symbol;Acc:HGNC:3394] GO
+3 GO:0005005 3.14 ENSG00000183317 EPHA10 EPH receptor A10 [Source:HGNC Symbol;Acc:HGNC:19987] GO
+3 GO:0005005 3.15 ENSG00000196411 EPHB4 EPH receptor B4 [Source:HGNC Symbol;Acc:HGNC:3395] GO
+3 GO:0005005 3.16 ENSG00000243364 EFNA4 ephrin A4 [Source:HGNC Symbol;Acc:HGNC:3224] GO
+5 NLRP1 5.1 ENSG00000091592 NLRP1 NLR family pyrin domain containing 1 [Source:HGNC Symbol;Acc:HGNC:14374] ENTREZGENE,HGNC,UNIPROT_GN,WIKIGENE
+2 rs17396340 2.1 ENSG00000054523 KIF1B kinesin family member 1B [Source:HGNC Symbol;Acc:HGNC:16636]
+1 X:1000:1000000 1.1 ENSG00000167393 PPP2R3B protein phosphatase 2 regulatory subunit B''beta [Source:HGNC Symbol;Acc:HGNC:13417]
+1 X:1000:1000000 1.2 ENSG00000178605 GTPBP6 GTP binding protein 6 (putative) [Source:HGNC Symbol;Acc:HGNC:30189]
+1 X:1000:1000000 1.3 ENSG00000182378 PLCXD1 phosphatidylinositol specific phospholipase C X domain containing 1 [Source:HGNC Symbol;Acc:HGNC:23148]
+1 X:1000:1000000 1.4 ENSG00000185960 SHOX short stature homeobox [Source:HGNC Symbol;Acc:HGNC:10853]
+1 X:1000:1000000 1.5 ENSG00000226179 LINC00685 long intergenic non-protein coding RNA 685 [Source:HGNC Symbol;Acc:HGNC:27560]
+1 X:1000:1000000 1.6 ENSG00000228572 AL954722.1 regucalcin (RGN) pseudogene
+1 X:1000:1000000 1.7 ENSG00000229232 KRT18P53 keratin 18 pseudogene 53 [Source:HGNC Symbol;Acc:HGNC:38714]
+1 X:1000:1000000 1.8 ENSG00000234958 FABP5P13 fatty acid binding protein 5 pseudogene 13 [Source:HGNC Symbol;Acc:HGNC:38717]
+1 X:1000:1000000 1.9 ENSG00000237531 AL672277.1 novel transcript
+1 X:1000:1000000 1.10 ENSG00000275287 RF00017 None
+1 X:1000:1000000 1.11 ENSG00000280767 AL732314.4 novel transcript
+1 X:1000:1000000 1.12 ENSG00000281849 AL732314.6 novel transcript, antisense to PPP2R3B
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_convert_results_2.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_convert_results_2.txt Thu Nov 14 06:00:14 2019 -0500
[
@@ -0,0 +1,22 @@
+input_number input target_number target name description namespace
+21 114142 21.1 AC122816 Foxp2 forkhead box P2 [Source:MGI Symbol;Acc:MGI:2148705] WIKIGENE_ACC
+2 ENSMUSG00000004791 2.1 AC127582 Pgf placental growth factor [Source:MGI Symbol;Acc:MGI:105095] ARRAYEXPRESS,ENSG
+1 ENSMUSG00000009900 1.1 X56842 Wnt3a wingless-type MMTV integration site family, member 3A [Source:MGI Symbol;Acc:MGI:98956] ARRAYEXPRESS,ENSG
+15 ENSMUSG00000017756 15.1 AC158359 Slc12a7 solute carrier family 12, member 7 [Source:MGI Symbol;Acc:MGI:1342283] ARRAYEXPRESS,ENSG
+16 ENSMUSG00000021678 16.1 AK144986 F2rl1 coagulation factor II (thrombin) receptor-like 1 [Source:MGI Symbol;Acc:MGI:101910] ARRAYEXPRESS,ENSG
+7 ENSMUSG00000027168 7.1 AK028059 Pax6 paired box 6 [Source:MGI Symbol;Acc:MGI:97490] ARRAYEXPRESS,ENSG
+10 ENSMUSG00000028164 10.1 AC110164 Manba mannosidase, beta A, lysosomal [Source:MGI Symbol;Acc:MGI:88175] ARRAYEXPRESS,ENSG
+12 ENSMUSG00000028341 12.1 AF191211 Nr4a3 nuclear receptor subfamily 4, group A, member 3 [Source:MGI Symbol;Acc:MGI:1352457] ARRAYEXPRESS,ENSG
+6 ENSMUSG00000029909 6.1 AK006028 Prss37 protease, serine 37 [Source:MGI Symbol;Acc:MGI:1914940] ARRAYEXPRESS,ENSG
+18 ENSMUSG00000030036 18.1 AF001797 Mogs mannosyl-oligosaccharide glucosidase [Source:MGI Symbol;Acc:MGI:1929872] ARRAYEXPRESS,ENSG
+9 ENSMUSG00000031256 9.1 AF317552 Cstf2 cleavage stimulation factor, 3' pre-RNA subunit 2 [Source:MGI Symbol;Acc:MGI:1343054] ARRAYEXPRESS,ENSG
+3 ENSMUSG00000031520 3.1 AK047844 Vegfc vascular endothelial growth factor C [Source:MGI Symbol;Acc:MGI:109124] ARRAYEXPRESS,ENSG
+11 ENSMUSG00000031871 11.1 AC132390 Cdh5 cadherin 5 [Source:MGI Symbol;Acc:MGI:105057] ARRAYEXPRESS,ENSG
+4 ENSMUSG00000035273 4.1 AC161510 Hpse heparanase [Source:MGI Symbol;Acc:MGI:1343124] ARRAYEXPRESS,ENSG
+20 ENSMUSG00000038886 20.1 AC136740 Man2a2 mannosidase 2, alpha 2 [Source:MGI Symbol;Acc:MGI:2150656] ARRAYEXPRESS,ENSG
+5 ENSMUSG00000039100 5.1 AK042980 March6 membrane-associated ring finger (C3HC4) 6 [Source:MGI Symbol;Acc:MGI:2442773] ARRAYEXPRESS,ENSG
+14 ENSMUSG00000047719 14.1 AK004550 Ubiad1 UbiA prenyltransferase domain containing 1 [Source:MGI Symbol;Acc:MGI:1918957] ARRAYEXPRESS,ENSG
+17 ENSMUSG00000048000 17.1 AC157811 Gigyf2 GRB10 interacting GYF protein 2 [Source:MGI Symbol;Acc:MGI:2138584] ARRAYEXPRESS,ENSG
+13 ENSMUSG00000061665 13.1 AC111082 Cd2ap CD2-associated protein [Source:MGI Symbol;Acc:MGI:1330281] ARRAYEXPRESS,ENSG
+19 ENSMUSG00000074934 19.1 AF045801 Grem1 gremlin 1, DAN family BMP antagonist [Source:MGI Symbol;Acc:MGI:1344337] ARRAYEXPRESS,ENSG
+8 ENSMUSG00000079644 8.1 AC138616 Gm1110 predicted gene 1110 [Source:MGI Symbol;Acc:MGI:2685956] ARRAYEXPRESS,ENSG
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_gost_results.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_gost_results.txt Thu Nov 14 06:00:14 2019 -0500
b
b'@@ -0,0 +1,198 @@\n+query\tsignificant\tp_value\tterm_size\tquery_size\tintersection_size\tprecision\trecall\tterm_id\tsource\tterm_name\teffective_domain_size\tsource_order\tparents\n+query_1\tTRUE\t9.34374617405934e-31\t81\t22\t16\t0.727272727272727\t0.197530864197531\tGO:0048013\tGO:BP\tephrin receptor signaling pathway\t17622\t14818\tGO:0007169\n+query_1\tTRUE\t3.66537061342834e-16\t245\t22\t13\t0.590909090909091\t0.0530612244897959\tGO:0070374\tGO:BP\tpositive regulation of ERK1 and ERK2 cascade\t17622\t19303\tGO:0070371,GO:0043410,GO:0070372\n+query_1\tTRUE\t2.12399259822471e-15\t388\t22\t14\t0.636363636363636\t0.0360824742268041\tGO:0018108\tGO:BP\tpeptidyl-tyrosine phosphorylation\t17622\t6073\tGO:0006468,GO:0018212\n+query_1\tTRUE\t2.3671188038973e-15\t391\t22\t14\t0.636363636363636\t0.0358056265984655\tGO:0018212\tGO:BP\tpeptidyl-tyrosine modification\t17622\t6164\tGO:0018193\n+query_1\tTRUE\t2.83458830649309e-15\t697\t22\t16\t0.727272727272727\t0.0229555236728838\tGO:0007169\tGO:BP\ttransmembrane receptor protein tyrosine kinase signaling pathway\t17622\t3117\tGO:0007167\n+query_1\tTRUE\t1.44639156267605e-14\t324\t22\t13\t0.590909090909091\t0.0401234567901235\tGO:0070372\tGO:BP\tregulation of ERK1 and ERK2 cascade\t17622\t19301\tGO:0043408,GO:0070371\n+query_1\tTRUE\t2.82352928169304e-14\t341\t22\t13\t0.590909090909091\t0.0381231671554252\tGO:0070371\tGO:BP\tERK1 and ERK2 cascade\t17622\t19300\tGO:0000165\n+query_1\tTRUE\t1.18922250318022e-12\t1020\t22\t16\t0.727272727272727\t0.0156862745098039\tGO:0007167\tGO:BP\tenzyme linked receptor protein signaling pathway\t17622\t3115\tGO:0007166\n+query_1\tTRUE\t1.97042419708341e-11\t565\t22\t13\t0.590909090909091\t0.0230088495575221\tGO:0043410\tGO:BP\tpositive regulation of MAPK cascade\t17622\t12470\tGO:0043408,GO:1902533,GO:0000165,GO:0001934\n+query_1\tTRUE\t4.14375764393441e-10\t264\t22\t10\t0.454545454545455\t0.0378787878787879\tGO:0007411\tGO:BP\taxon guidance\t17622\t3333\tGO:0097485,GO:0007409\n+query_1\tTRUE\t4.30355852796394e-10\t265\t22\t10\t0.454545454545455\t0.0377358490566038\tGO:0097485\tGO:BP\tneuron projection guidance\t17622\t22468\tGO:0006928,GO:0006935,GO:0048812\n+query_1\tTRUE\t1.21912705663141e-09\t780\t22\t13\t0.590909090909091\t0.0166666666666667\tGO:0043408\tGO:BP\tregulation of MAPK cascade\t17622\t12468\tGO:0001932,GO:1902531,GO:0000165\n+query_1\tTRUE\t6.55773650056281e-09\t496\t22\t11\t0.5\t0.0221774193548387\tGO:0061564\tGO:BP\taxon development\t17622\t18795\tGO:0031175\n+query_1\tTRUE\t1.11680978622729e-08\t929\t22\t13\t0.590909090909091\t0.0139935414424112\tGO:0000165\tGO:BP\tMAPK cascade\t17622\t72\tGO:0035556,GO:0023014\n+query_1\tTRUE\t1.40392803081479e-08\t946\t22\t13\t0.590909090909091\t0.0137420718816068\tGO:0043066\tGO:BP\tnegative regulation of apoptotic process\t17622\t12291\tGO:0006915,GO:0043069,GO:0042981\n+query_1\tTRUE\t1.46112034570365e-08\t949\t22\t13\t0.590909090909091\t0.0136986301369863\tGO:0023014\tGO:BP\tsignal transduction by protein phosphorylation\t17622\t7706\tGO:0007165,GO:0006468\n+query_1\tTRUE\t1.4941304807234e-08\t1214\t22\t14\t0.636363636363636\t0.0115321252059308\tGO:0018193\tGO:BP\tpeptidyl-amino acid modification\t17622\t6145\tGO:0006464\n+query_1\tTRUE\t1.51174121581038e-08\t726\t22\t12\t0.545454545454545\t0.0165289256198347\tGO:0000904\tGO:BP\tcell morphogenesis involved in differentiation\t17622\t315\tGO:0000902,GO:0048468\n+query_1\tTRUE\t1.68959705719079e-08\t960\t22\t13\t0.590909090909091\t0.0135416666666667\tGO:0043069\tGO:BP\tnegative regulation of programmed cell death\t17622\t12294\tGO:0043067,GO:0012501,GO:0060548\n+query_1\tTRUE\t2.8817204840834e-08\t1589\t22\t15\t0.681818181818182\t0.00943989930774072\tGO:0032270\tGO:BP\tpositive regulation of cellular protein metabolic process\t17622\t8735\tGO:0044267,GO:0031325,GO:0051247,GO:0032268\n+query_1\tTRUE\t3.36463871373171e-08\t1014\t22\t13\t0.590909090909091\t0.0128205128205128\tGO:0001934\tGO:BP\tpositive regulation of protein phosphorylation\t17622\t680\tGO:0001932,GO:0031401,GO:0042327,GO:0006468\n+query_1\tTRUE\t3.75984663526078e-08\t1023\t22\t13\t0.590909090909091\t0.0127077223851417\tGO:1902533\tGO:BP\tpositive regulation of intracellular signal transduction\t17622\t25966\tGO:1902531,GO:0009967,GO:0035556\n+query_1\tTRUE\t4.7948657304268e-08\t1043\t22\t13\t0.59090'..b' protein\t17516\t11743\tGO:0003824\n+query_1\tTRUE\t6.55566958954096e-09\t1491\t23\t15\t0.652173913043478\t0.0100603621730382\tGO:0005524\tGO:MF\tATP binding\t17516\t1923\tGO:0032559,GO:0008144,GO:0035639\n+query_1\tTRUE\t7.55843118636016e-09\t1839\t23\t16\t0.695652173913043\t0.00870038064165307\tGO:0035639\tGO:MF\tpurine ribonucleoside triphosphate binding\t17516\t6444\tGO:0043168,GO:1901265\n+query_1\tTRUE\t1.11330396526275e-08\t1547\t23\t15\t0.652173913043478\t0.0096961861667744\tGO:0032559\tGO:MF\tadenyl ribonucleotide binding\t17516\t5495\tGO:0030554,GO:0032555\n+query_1\tTRUE\t1.25529311221511e-08\t1560\t23\t15\t0.652173913043478\t0.00961538461538462\tGO:0030554\tGO:MF\tadenyl nucleotide binding\t17516\t4960\tGO:0017076\n+query_1\tTRUE\t1.27499353595253e-08\t1903\t23\t16\t0.695652173913043\t0.00840777719390436\tGO:0032555\tGO:MF\tpurine ribonucleotide binding\t17516\t5491\tGO:0032553,GO:0017076\n+query_1\tTRUE\t1.43733018581564e-08\t1918\t23\t16\t0.695652173913043\t0.00834202294056309\tGO:0032553\tGO:MF\tribonucleotide binding\t17516\t5489\tGO:0000166,GO:0097367\n+query_1\tTRUE\t1.43733018581564e-08\t1918\t23\t16\t0.695652173913043\t0.00834202294056309\tGO:0017076\tGO:MF\tpurine nucleotide binding\t17516\t4025\tGO:0000166\n+query_1\tTRUE\t6.12626333869313e-08\t1743\t23\t15\t0.652173913043478\t0.00860585197934595\tGO:0008144\tGO:MF\tdrug binding\t17516\t2037\tGO:0005488\n+query_1\tTRUE\t8.33064536428471e-08\t2153\t23\t16\t0.695652173913043\t0.00743149094287041\tGO:0000166\tGO:MF\tnucleotide binding\t17516\t35\tGO:1901265,GO:0036094\n+query_1\tTRUE\t8.38943008503727e-08\t2154\t23\t16\t0.695652173913043\t0.0074280408542247\tGO:1901265\tGO:MF\tnucleoside phosphate binding\t17516\t11790\tGO:1901363,GO:0097159\n+query_1\tTRUE\t8.74477667929715e-08\t9\t23\t4\t0.173913043478261\t0.444444444444444\tGO:0008046\tGO:MF\taxon guidance receptor activity\t17516\t1979\tGO:0004888\n+query_1\tTRUE\t8.79830072527301e-08\t29\t23\t5\t0.217391304347826\t0.172413793103448\tGO:0046875\tGO:MF\tephrin receptor binding\t17516\t7458\tGO:0005102\n+query_1\tTRUE\t1.41735168585418e-07\t2230\t23\t16\t0.695652173913043\t0.00717488789237668\tGO:0097367\tGO:MF\tcarbohydrate derivative binding\t17516\t10444\tGO:0005488\n+query_1\tTRUE\t4.28578386119048e-07\t2400\t23\t16\t0.695652173913043\t0.00666666666666667\tGO:0016740\tGO:MF\ttransferase activity\t17516\t3776\tGO:0003824\n+query_1\tTRUE\t1.01396980184892e-06\t2542\t23\t16\t0.695652173913043\t0.00629425649095201\tGO:0036094\tGO:MF\tsmall molecule binding\t17516\t6491\tGO:0005488\n+query_1\tTRUE\t3.8415814367379e-06\t2780\t23\t16\t0.695652173913043\t0.00575539568345324\tGO:0043168\tGO:MF\tanion binding\t17516\t6889\tGO:0043167\n+query_1\tTRUE\t6.56309698694573e-05\t5931\t23\t20\t0.869565217391304\t0.00337211262856179\tGO:0003824\tGO:MF\tcatalytic activity\t17516\t533\tGO:0003674\n+query_1\tTRUE\t0.0099786563469161\t6191\t23\t18\t0.782608695652174\t0.00290744629300598\tGO:0043167\tGO:MF\tion binding\t17516\t6888\tGO:0005488\n+query_1\tTRUE\t9.58039478222354e-21\t173\t18\t15\t0.833333333333333\t0.0867052023121387\tKEGG:04360\tKEGG\tAxon guidance\t7332\t281\tKEGG:00000\n+query_1\tTRUE\t4.25184672520151e-33\t49\t20\t16\t0.8\t0.326530612244898\tREAC:R-HSA-3928665\tREAC\tEPH-ephrin mediated repulsion of cells\t10478\t677\tREAC:R-HSA-2682334\n+query_1\tTRUE\t2.68599230814021e-28\t90\t20\t16\t0.8\t0.177777777777778\tREAC:R-HSA-2682334\tREAC\tEPH-Ephrin signaling\t10478\t676\tREAC:R-HSA-422475\n+query_1\tTRUE\t2.26036763613955e-22\t28\t20\t11\t0.55\t0.392857142857143\tREAC:R-HSA-3928663\tREAC\tEPHA-mediated growth cone collapse\t10478\t678\tREAC:R-HSA-2682334\n+query_1\tTRUE\t2.67681092605614e-15\t548\t20\t16\t0.8\t0.0291970802919708\tREAC:R-HSA-422475\tREAC\tAxon guidance\t10478\t169\tREAC:R-HSA-1266738\n+query_1\tTRUE\t9.95911717421585e-11\t1064\t20\t16\t0.8\t0.0150375939849624\tREAC:R-HSA-1266738\tREAC\tDevelopmental Biology\t10478\t626\tREAC:0000000\n+query_1\tTRUE\t2.37947163940067e-08\t17\t20\t5\t0.25\t0.294117647058824\tREAC:R-HSA-3928664\tREAC\tEphrin signaling\t10478\t704\tREAC:R-HSA-2682334\n+query_1\tTRUE\t2.4616095376173e-06\t40\t20\t5\t0.25\t0.125\tREAC:R-HSA-3928662\tREAC\tEPHB-mediated forward signaling\t10478\t679\tREAC:R-HSA-2682334\n+query_1\tTRUE\t0.0279390317807751\t21\t10\t2\t0.2\t0.0952380952380952\tWP:WP4331\tWP\tNeovascularisation processes\t6376\t194\tWP:000000\n'
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_gost_results_2.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_gost_results_2.txt Thu Nov 14 06:00:14 2019 -0500
b
b'@@ -0,0 +1,289 @@\n+query\tsignificant\tp_value\tterm_size\tquery_size\tintersection_size\tprecision\trecall\tterm_id\tsource\tterm_name\teffective_domain_size\tsource_order\tparents\tevidence_codes\tintersection\n+query_1\tFALSE\t1\t6759\t11\t4\t0.363636363636364\t0.000591803521230951\tGO:0016020\tGO:CC\tmembrane\t55341\t870\tGO:0005575\tISO,IDA,ISS ISO IBA,IDA ISO IBA\tENSMUSG00000009900,ENSMUSG00000035273,ENSMUSG00000039100,ENSMUSG00000031871\n+query_1\tFALSE\t1\t385\t13\t1\t0.0769230769230769\t0.0025974025974026\tGO:0015629\tGO:CC\tactin cytoskeleton\t55341\t857\tGO:0005856\tISO\tENSMUSG00000061665\n+query_1\tFALSE\t1\t2957\t5\t2\t0.4\t0.000676361176868448\tGO:0012505\tGO:CC\tendomembrane system\t55341\t837\tGO:0044464\tTAS,ISS ISO IBA\tENSMUSG00000009900,ENSMUSG00000039100\n+query_1\tFALSE\t1\t56\t17\t1\t0.0588235294117647\t0.0178571428571429\tGO:0010494\tGO:CC\tcytoplasmic stress granule\t55341\t835\tGO:0036464\tISO\tENSMUSG00000048000\n+query_1\tFALSE\t1\t908\t11\t2\t0.181818181818182\t0.00220264317180617\tGO:0009986\tGO:CC\tcell surface\t55341\t811\tGO:0044464\tIDA,IDA ISO IBA\tENSMUSG00000009900,ENSMUSG00000031871\n+query_1\tFALSE\t1\t481\t11\t1\t0.0909090909090909\t0.00207900207900208\tGO:0009897\tGO:CC\texternal side of plasma membrane\t55341\t804\tGO:0044459,GO:0098552,GO:0009986\tIDA\tENSMUSG00000031871\n+query_1\tFALSE\t1\t2927\t14\t2\t0.142857142857143\t0.000683293474547318\tGO:0016021\tGO:CC\tintegral component of membrane\t55341\t871\tGO:0031224\tISS ISO IBA,ISS ISO IBA\tENSMUSG00000039100,ENSMUSG00000047719\n+query_1\tFALSE\t1\t259\t13\t1\t0.0769230769230769\t0.00386100386100386\tGO:0005938\tGO:CC\tcell cortex\t55341\t580\tGO:0071944,GO:0099568\tISO\tENSMUSG00000061665\n+query_1\tFALSE\t1\t96\t11\t1\t0.0909090909090909\t0.0104166666666667\tGO:0005913\tGO:CC\tcell-cell adherens junction\t55341\t556\tGO:0005912,GO:0005911\tIDA ISO IBA\tENSMUSG00000031871\n+query_1\tFALSE\t1\t254\t11\t1\t0.0909090909090909\t0.00393700787401575\tGO:0005912\tGO:CC\tadherens junction\t55341\t555\tGO:0070161\tIDA ISO IBA\tENSMUSG00000031871\n+query_1\tFALSE\t1\t393\t11\t1\t0.0909090909090909\t0.00254452926208651\tGO:0005911\tGO:CC\tcell-cell junction\t55341\t554\tGO:0030054\tIDA ISO IBA\tENSMUSG00000031871\n+query_1\tFALSE\t1\t1293\t16\t1\t0.0625\t0.000773395204949729\tGO:0005887\tGO:CC\tintegral component of plasma membrane\t55341\t533\tGO:0031226,GO:0016021\tISO IBA\tENSMUSG00000021678\n+query_1\tFALSE\t1\t4065\t11\t2\t0.181818181818182\t0.0004920049200492\tGO:0005886\tGO:CC\tplasma membrane\t55341\t532\tGO:0016020,GO:0044464,GO:0071944\tISO,IDA ISO IBA\tENSMUSG00000009900,ENSMUSG00000031871\n+query_1\tFALSE\t1\t98\t13\t1\t0.0769230769230769\t0.0102040816326531\tGO:0005884\tGO:CC\tactin filament\t55341\t530\tGO:0015629,GO:0099513\tISO\tENSMUSG00000061665\n+query_1\tFALSE\t1\t83\t11\t1\t0.0909090909090909\t0.0120481927710843\tGO:0005923\tGO:CC\tbicellular tight junction\t55341\t566\tGO:0043296,GO:0070160\tIDA IBA\tENSMUSG00000031871\n+query_1\tFALSE\t1\t1509\t13\t1\t0.0769230769230769\t0.000662690523525514\tGO:0005856\tGO:CC\tcytoskeleton\t55341\t509\tGO:0043232\tISO\tENSMUSG00000061665\n+query_1\tFALSE\t1\t23\t11\t1\t0.0909090909090909\t0.0434782608695652\tGO:0016342\tGO:CC\tcatenin complex\t55341\t887\tGO:0098797,GO:0019897\tIBA\tENSMUSG00000031871\n+query_1\tFALSE\t1\t164\t11\t1\t0.0909090909090909\t0.00609756097560976\tGO:0019897\tGO:CC\textrinsic component of plasma membrane\t55341\t1004\tGO:0019898,GO:0044459\tIBA\tENSMUSG00000031871\n+query_1\tFALSE\t1\t45\t14\t1\t0.0714285714285714\t0.0222222222222222\tGO:0031228\tGO:CC\tintrinsic component of Golgi membrane\t55341\t1262\tGO:0000139,GO:0044431,GO:0031300\tISS ISO IBA\tENSMUSG00000047719\n+query_1\tFALSE\t1\t126\t5\t1\t0.2\t0.00793650793650794\tGO:0031227\tGO:CC\tintrinsic component of endoplasmic reticulum membrane\t55341\t1261\tGO:0031224,GO:0005789,GO:0044432\tISS ISO IBA\tENSMUSG00000039100\n+query_1\tFALSE\t1\t1355\t16\t1\t0.0625\t0.000738007380073801\tGO:0031226\tGO:CC\tintrinsic component of plasma membrane\t55341\t1260\tGO:0044459,GO:0031224\tISO IBA\tENSMUSG00000021678\n+query_1\tFALSE\t1\t3038\t14\t2\t0.142857142857143\t0.000658327847267939\tGO:0031224\tGO:CC\tintrinsic component of membrane\t55341\t1258\tGO:0044425\tISS ISO IBA,ISS ISO IBA\tENSMUSG00000039100,ENSMUSG00000047719\n+query_1\tFALSE\t1\t12\t16\t1\t0.0625\t0.083333333333'..b'1\t0.0526315789473684\t0.0138888888888889\tGO:0019209\tGO:MF\tkinase activator activity\t55341\t4601\tGO:0008047,GO:0019207\tIDA\tENSMUSG00000074934\n+query_1\tFALSE\t1\t174\t19\t1\t0.0526315789473684\t0.00574712643678161\tGO:0019207\tGO:MF\tkinase regulator activity\t55341\t4599\tGO:0030234\tIDA\tENSMUSG00000074934\n+query_1\tFALSE\t1\t81\t13\t1\t0.0769230769230769\t0.0123456790123457\tGO:0017124\tGO:MF\tSH3 domain binding\t55341\t4056\tGO:0019904\tISO\tENSMUSG00000061665\n+query_1\tFALSE\t1\t104\t12\t1\t0.0833333333333333\t0.00961538461538462\tGO:0016922\tGO:MF\tnuclear receptor binding\t55341\t3945\tGO:0035257\tISO IBA\tENSMUSG00000028341\n+query_1\tFALSE\t1\t17\t20\t1\t0.05\t0.0588235294117647\tGO:0016799\tGO:MF\thydrolase activity, hydrolyzing N-glycosyl compounds\t55341\t3829\tGO:0016798\tIDA\tENSMUSG00000038886\n+query_1\tFALSE\t1\t93\t4\t1\t0.25\t0.010752688172043\tGO:0016798\tGO:MF\thydrolase activity, acting on glycosyl bonds\t55341\t3828\tGO:0016787\tISS ISO\tENSMUSG00000035273\n+query_1\tFALSE\t1\t373\t5\t1\t0.2\t0.00268096514745308\tGO:0019787\tGO:MF\tubiquitin-like protein transferase activity\t55341\t4642\tGO:0016740,GO:0140096\tISO\tENSMUSG00000039100\n+query_1\tFALSE\t1\t243\t15\t1\t0.0666666666666667\t0.00411522633744856\tGO:0022804\tGO:MF\tactive transmembrane transporter activity\t55341\t4729\tGO:0022857\tIBA\tENSMUSG00000017756\n+query_1\tFALSE\t1\t794\t15\t1\t0.0666666666666667\t0.00125944584382872\tGO:0022857\tGO:MF\ttransmembrane transporter activity\t55341\t4760\tGO:0005215\tIBA\tENSMUSG00000017756\n+query_1\tFALSE\t1\t452\t15\t1\t0.0666666666666667\t0.00221238938053097\tGO:0022890\tGO:MF\tinorganic cation transmembrane transporter activity\t55341\t4785\tGO:0008324,GO:0015318\tIBA\tENSMUSG00000017756\n+query_1\tFALSE\t1\t19\t12\t1\t0.0833333333333333\t0.0526315789473684\tGO:0035259\tGO:MF\tglucocorticoid receptor binding\t55341\t6380\tGO:0035258,GO:0016922\tISO IBA\tENSMUSG00000028341\n+query_1\tFALSE\t1\t78\t12\t1\t0.0833333333333333\t0.0128205128205128\tGO:0035258\tGO:MF\tsteroid hormone receptor binding\t55341\t6379\tGO:0035257\tISO IBA\tENSMUSG00000028341\n+query_1\tFALSE\t1\t137\t12\t1\t0.0833333333333333\t0.0072992700729927\tGO:0035257\tGO:MF\tnuclear hormone receptor binding\t55341\t6378\tGO:0051427,GO:0061629\tISO IBA\tENSMUSG00000028341\n+query_1\tFALSE\t1\t32\t7\t1\t0.142857142857143\t0.03125\tGO:0035035\tGO:MF\thistone acetyltransferase binding\t55341\t6352\tGO:0019899\tIDA\tENSMUSG00000027168\n+query_1\tFALSE\t1\t6\t16\t1\t0.0625\t0.166666666666667\tGO:0032795\tGO:MF\theterotrimeric G-protein binding\t55341\t5512\tGO:0044877\tTAS\tENSMUSG00000021678\n+query_1\tFALSE\t1\t15\t16\t1\t0.0625\t0.0666666666666667\tGO:0031681\tGO:MF\tG-protein beta-subunit binding\t55341\t5181\tGO:0005515\tIDA\tENSMUSG00000021678\n+query_1\tFALSE\t1\t281\t7\t1\t0.142857142857143\t0.00355871886120996\tGO:0031625\tGO:MF\tubiquitin protein ligase binding\t55341\t5176\tGO:0044389\tIPI\tENSMUSG00000027168\n+query_1\tFALSE\t1\t32\t5\t1\t0.2\t0.03125\tGO:0031624\tGO:MF\tubiquitin conjugating enzyme binding\t55341\t5175\tGO:0044390\tISO\tENSMUSG00000039100\n+query_1\tFALSE\t1\t8\t19\t1\t0.0526315789473684\t0.125\tGO:0030546\tGO:MF\treceptor activator activity\t55341\t4952\tGO:0030545\tIDA\tENSMUSG00000074934\n+query_1\tFALSE\t1\t384\t19\t4\t0.210526315789474\t0.0104166666666667\tGO:0030545\tGO:MF\treceptor regulator activity\t55341\t4951\tGO:0098772\tIDA ISO,ISS ISO IBA,ISO IBA,IDA IPI\tENSMUSG00000009900,ENSMUSG00000004791,ENSMUSG00000031520,ENSMUSG00000074934\n+query_1\tFALSE\t1\t1\t4\t1\t0.25\t1\tGO:0030305\tGO:MF\theparanase activity\t55341\t4880\tGO:0004553\tISS ISO\tENSMUSG00000035273\n+query_1\tFALSE\t1\t4\t19\t1\t0.0526315789473684\t0.25\tGO:0030297\tGO:MF\ttransmembrane receptor protein tyrosine kinase activator activity\t55341\t4876\tGO:0030296,GO:0030546\tIDA\tENSMUSG00000074934\n+query_1\tFALSE\t1\t16\t19\t1\t0.0526315789473684\t0.0625\tGO:0030296\tGO:MF\tprotein tyrosine kinase activator activity\t55341\t4875\tGO:0030295\tIDA\tENSMUSG00000074934\n+query_1\tFALSE\t1\t65\t19\t1\t0.0526315789473684\t0.0153846153846154\tGO:0030295\tGO:MF\tprotein kinase activator activity\t55341\t4874\tGO:0019887,GO:0019209\tIDA\tENSMUSG00000074934\n+query_1\tFALSE\t1\t757\t19\t1\t0.0526315789473684\t0.00132100396301189\tGO:0030234\tGO:MF\tenzyme regulator activity\t55341\t4846\tGO:0098772\tIDA\tENSMUSG00000074934\n'
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_orth_results.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_orth_results.txt Thu Nov 14 06:00:14 2019 -0500
[
@@ -0,0 +1,33 @@
+input_number input input_ensg ensg_number ortholog_name ortholog_ensg description
+4 ENSG00000156103 ENSG00000156103 4.1.1 Mmp16 ENSMUSG00000028226 matrix metallopeptidase 16 [Source:MGI Symbol;Acc:MGI:1276107]
+3 GO:0005005 ENSG00000044524 3.1.1 Epha3 ENSMUSG00000052504 Eph receptor A3 [Source:MGI Symbol;Acc:MGI:99612]
+3 GO:0005005 ENSG00000070886 3.2.1 Epha8 ENSMUSG00000028661 Eph receptor A8 [Source:MGI Symbol;Acc:MGI:109378]
+3 GO:0005005 ENSG00000080224 3.3.1 Epha6 ENSMUSG00000055540 Eph receptor A6 [Source:MGI Symbol;Acc:MGI:108034]
+3 GO:0005005 ENSG00000108947 3.4.1 Efnb3 ENSMUSG00000003934 ephrin B3 [Source:MGI Symbol;Acc:MGI:109196]
+3 GO:0005005 ENSG00000116106 3.5.1 Epha4 ENSMUSG00000026235 Eph receptor A4 [Source:MGI Symbol;Acc:MGI:98277]
+3 GO:0005005 ENSG00000133216 3.6.1 Ephb2 ENSMUSG00000028664 Eph receptor B2 [Source:MGI Symbol;Acc:MGI:99611]
+3 GO:0005005 ENSG00000135333 3.7.1 Epha7 ENSMUSG00000028289 Eph receptor A7 [Source:MGI Symbol;Acc:MGI:95276]
+3 GO:0005005 ENSG00000142627 3.8.1 Epha2 ENSMUSG00000006445 Eph receptor A2 [Source:MGI Symbol;Acc:MGI:95278]
+3 GO:0005005 ENSG00000143590 3.9.1 Efna3 ENSMUSG00000028039 ephrin A3 [Source:MGI Symbol;Acc:MGI:106644]
+3 GO:0005005 ENSG00000145242 3.10.1 Epha5 ENSMUSG00000029245 Eph receptor A5 [Source:MGI Symbol;Acc:MGI:99654]
+3 GO:0005005 ENSG00000146904 3.11.1 Epha1 ENSMUSG00000029859 Eph receptor A1 [Source:MGI Symbol;Acc:MGI:107381]
+3 GO:0005005 ENSG00000154928 3.12.1 Ephb1 ENSMUSG00000032537 Eph receptor B1 [Source:MGI Symbol;Acc:MGI:1096337]
+3 GO:0005005 ENSG00000182580 3.13.1 Ephb3 ENSMUSG00000005958 Eph receptor B3 [Source:MGI Symbol;Acc:MGI:104770]
+3 GO:0005005 ENSG00000183317 3.14.1 Epha10 ENSMUSG00000028876 Eph receptor A10 [Source:MGI Symbol;Acc:MGI:3586824]
+3 GO:0005005 ENSG00000196411 3.15.1 Ephb4 ENSMUSG00000029710 Eph receptor B4 [Source:MGI Symbol;Acc:MGI:104757]
+3 GO:0005005 ENSG00000243364 3.16.1 Efna4 ENSMUSG00000028040 ephrin A4 [Source:MGI Symbol;Acc:MGI:106643]
+5 NLRP1 ENSG00000091592 5.1.1 Nlrp1a ENSMUSG00000069830 NLR family, pyrin domain containing 1A [Source:MGI Symbol;Acc:MGI:2684861]
+5 NLRP1 ENSG00000091592 5.1.2 Nlrp1b ENSMUSG00000070390 NLR family, pyrin domain containing 1B [Source:MGI Symbol;Acc:MGI:3582959]
+2 rs17396340 ENSG00000054523 2.1.1 Kif1b ENSMUSG00000063077 kinesin family member 1B [Source:MGI Symbol;Acc:MGI:108426]
+1 X:1000:1000000 ENSG00000167393 1.1.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000178605 1.2.1 Gtpbp6 ENSMUSG00000033434 GTP binding protein 6 (putative) [Source:MGI Symbol;Acc:MGI:1306825]
+1 X:1000:1000000 ENSG00000182378 1.3.1 Plcxd1 ENSMUSG00000064247 phosphatidylinositol-specific phospholipase C, X domain containing 1 [Source:MGI Symbol;Acc:MGI:2685422]
+1 X:1000:1000000 ENSG00000185960 1.4.1 Rhox10 ENSMUSG00000053909 reproductive homeobox 10 [Source:MGI Symbol;Acc:MGI:3580249]
+1 X:1000:1000000 ENSG00000226179 1.5.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000228572 1.6.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000229232 1.7.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000234958 1.8.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000237531 1.9.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000275287 1.10.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000280767 1.11.1 N/A N/A N/A
+1 X:1000:1000000 ENSG00000281849 1.12.1 N/A N/A N/A
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_orth_results_2.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_orth_results_2.txt Thu Nov 14 06:00:14 2019 -0500
[
@@ -0,0 +1,22 @@
+input_number input input_ensg ensg_number ortholog_name ortholog_ensg description
+21 114142 ENSMUSG00000029563 21.1.1 FOXP2 ENSG00000128573 forkhead box P2 [Source:HGNC Symbol;Acc:HGNC:13875]
+2 ENSMUSG00000004791 ENSMUSG00000004791 2.1.1 PGF ENSG00000119630 placental growth factor [Source:HGNC Symbol;Acc:HGNC:8893]
+1 ENSMUSG00000009900 ENSMUSG00000009900 1.1.1 WNT3A ENSG00000154342 Wnt family member 3A [Source:HGNC Symbol;Acc:HGNC:15983]
+15 ENSMUSG00000017756 ENSMUSG00000017756 15.1.1 SLC12A7 ENSG00000113504 solute carrier family 12 member 7 [Source:HGNC Symbol;Acc:HGNC:10915]
+16 ENSMUSG00000021678 ENSMUSG00000021678 16.1.1 F2RL1 ENSG00000164251 F2R like trypsin receptor 1 [Source:HGNC Symbol;Acc:HGNC:3538]
+7 ENSMUSG00000027168 ENSMUSG00000027168 7.1.1 PAX6 ENSG00000007372 paired box 6 [Source:HGNC Symbol;Acc:HGNC:8620]
+10 ENSMUSG00000028164 ENSMUSG00000028164 10.1.1 MANBA ENSG00000109323 mannosidase beta [Source:HGNC Symbol;Acc:HGNC:6831]
+12 ENSMUSG00000028341 ENSMUSG00000028341 12.1.1 NR4A3 ENSG00000119508 nuclear receptor subfamily 4 group A member 3 [Source:HGNC Symbol;Acc:HGNC:7982]
+6 ENSMUSG00000029909 ENSMUSG00000029909 6.1.1 PRSS37 ENSG00000165076 serine protease 37 [Source:HGNC Symbol;Acc:HGNC:29211]
+18 ENSMUSG00000030036 ENSMUSG00000030036 18.1.1 MOGS ENSG00000115275 mannosyl-oligosaccharide glucosidase [Source:HGNC Symbol;Acc:HGNC:24862]
+9 ENSMUSG00000031256 ENSMUSG00000031256 9.1.1 CSTF2 ENSG00000101811 cleavage stimulation factor subunit 2 [Source:HGNC Symbol;Acc:HGNC:2484]
+3 ENSMUSG00000031520 ENSMUSG00000031520 3.1.1 VEGFC ENSG00000150630 vascular endothelial growth factor C [Source:HGNC Symbol;Acc:HGNC:12682]
+11 ENSMUSG00000031871 ENSMUSG00000031871 11.1.1 CDH5 ENSG00000179776 cadherin 5 [Source:HGNC Symbol;Acc:HGNC:1764]
+4 ENSMUSG00000035273 ENSMUSG00000035273 4.1.1 HPSE ENSG00000173083 heparanase [Source:HGNC Symbol;Acc:HGNC:5164]
+20 ENSMUSG00000038886 ENSMUSG00000038886 20.1.1 MAN2A2 ENSG00000196547 mannosidase alpha class 2A member 2 [Source:HGNC Symbol;Acc:HGNC:6825]
+5 ENSMUSG00000039100 ENSMUSG00000039100 5.1.1 MARCH6 ENSG00000145495 membrane associated ring-CH-type finger 6 [Source:HGNC Symbol;Acc:HGNC:30550]
+14 ENSMUSG00000047719 ENSMUSG00000047719 14.1.1 UBIAD1 ENSG00000120942 UbiA prenyltransferase domain containing 1 [Source:HGNC Symbol;Acc:HGNC:30791]
+17 ENSMUSG00000048000 ENSMUSG00000048000 17.1.1 GIGYF2 ENSG00000204120 GRB10 interacting GYF protein 2 [Source:HGNC Symbol;Acc:HGNC:11960]
+13 ENSMUSG00000061665 ENSMUSG00000061665 13.1.1 CD2AP ENSG00000198087 CD2 associated protein [Source:HGNC Symbol;Acc:HGNC:14258]
+19 ENSMUSG00000074934 ENSMUSG00000074934 19.1.1 GREM1 ENSG00000166923 gremlin 1, DAN family BMP antagonist [Source:HGNC Symbol;Acc:HGNC:2001]
+8 ENSMUSG00000079644 ENSMUSG00000079644 8.1.1 N/A N/A N/A
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_query.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_query.txt Thu Nov 14 06:00:14 2019 -0500
b
@@ -0,0 +1,5 @@
+X:1000:1000000
+rs17396340
+GO:0005005
+ENSG00000156103
+NLRP1
\ No newline at end of file
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_query_2.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_query_2.txt Thu Nov 14 06:00:14 2019 -0500
b
@@ -0,0 +1,21 @@
+ENSMUSG00000009900
+ENSMUSG00000004791
+ENSMUSG00000031520
+ENSMUSG00000035273
+ENSMUSG00000039100
+ENSMUSG00000029909
+ENSMUSG00000027168
+ENSMUSG00000079644
+ENSMUSG00000031256
+ENSMUSG00000028164
+ENSMUSG00000031871
+ENSMUSG00000028341
+ENSMUSG00000061665
+ENSMUSG00000047719
+ENSMUSG00000017756
+ENSMUSG00000021678
+ENSMUSG00000048000
+ENSMUSG00000030036
+ENSMUSG00000074934
+ENSMUSG00000038886
+114142
\ No newline at end of file
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_snpense_query.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_snpense_query.txt Thu Nov 14 06:00:14 2019 -0500
b
@@ -0,0 +1,73 @@
+rs11734132
+rs7961894
+rs4305276
+rs17396340
+rs7616006
+rs944002
+rs7694379
+rs3184504
+rs700585
+rs7641175
+rs11628318
+rs1260326
+rs1558324
+rs342275
+rs2336384
+rs8022206
+rs1354034
+rs10761731
+rs11789898
+rs7075195
+rs2015599
+rs13300663
+rs1172130
+rs11082304
+rs10813766
+rs4246215
+rs1668871
+rs399604
+rs10512627
+rs3731211
+rs2297067
+rs8109288
+rs4148441
+rs397969
+rs4521516
+rs7342306
+rs441460
+rs559972
+rs6993770
+rs1719271
+rs409801
+rs7550918
+rs6065
+rs8006385
+rs17568628
+rs17030845
+rs17356664
+rs3819299
+rs13042885
+rs7317038
+rs10076782
+rs2070729
+rs12969657
+rs3809566
+rs4731120
+rs6995402
+rs625132
+rs16971217
+rs17655730
+rs649729
+rs8076739
+rs3811444
+rs6141
+rs10914144
+rs3000073
+rs9399137
+rs210134
+rs3792366
+rs4938642
+rs2227831
+rs1034566
+rs941207
+
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_snpense_results.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_snpense_results.txt Thu Nov 14 06:00:14 2019 -0500
b
@@ -0,0 +1,73 @@
+rs_id chromosome start end strand ensgs gene_names 3_prime_UTR_variant NMD_transcript_variant intron_variant missense_variant non_coding_transcript_exon_variant non_coding_transcript_variant splice_region_variant
+rs11734132 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs7961894 12 121927677 121927677 + ENSG00000158023 WDR66  0  0  3  0  0  1  0
+rs4305276 2 240555596 240555596 + ENSG00000144504 ANKMY1  0  0 57  0  0 18  0
+rs17396340 1  10226118  10226118 + ENSG00000054523 KIF1B  0  0  8  0  0  0  0
+rs7616006 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs944002 14 103106478 103106478 + ENSG00000205436 EXOC3L4  0  1  3  0  0  1  0
+rs7694379 4  87265357  87265357 + ENSG00000250572 AC108516.1  0  0  1  0  0  1  0
+rs3184504 12 111446804 111446804 + ENSG00000111252,ENSG00000204842 SH2B3,ATXN2  0  3  3 12  0  0  0
+rs700585 5  88856300  88856300 + ENSG00000081189 MEF2C  0  0 44  0  0  6  0
+rs7641175 3  18269920  18269920 + ENSG00000131374 TBC1D5  0  0  1  0  0  1  0
+rs11628318 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs1260326 2  27508073  27508073 + ENSG00000084734 GCKR  0  0  0  2  1  0  3
+rs1558324 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs342275 7 106718770 106718770 + ENSG00000243797 AC004917.1  0  0  2  0  0  2  0
+rs2336384 1  11986006  11986006 + ENSG00000116688 MFN2  0  0  7  0  0  3  0
+rs8022206 14  68054189  68054189 + ENSG00000182185 RAD51B  0  1 14  0  0  9  0
+rs1354034 3  56815721  56815721 + ENSG00000163947 ARHGEF3  0  2 10  0  0  3  0
+rs10761731 10  63267850  63267850 + ENSG00000171988 JMJD1C  0  0  6  0  0  4  0
+rs11789898 9 134060541 134060541 + ENSG00000169925 BRD3  0  0  2  0  0  0  0
+rs7075195 10  63290899  63290899 + ENSG00000171988 JMJD1C  0  0  2  0  0  1  0
+rs2015599 12  29282547  29282547 + ENSG00000064763,ENSG00000257176 FAR2,AC009318.1  0  1  7  0  0  2  0
+rs13300663 9   4814948   4814948 + ENSG00000120158 RCL1  0  0  8  0  0  2  0
+rs1172130 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs11082304 18  23141009  23141009 + ENSG00000134508 CABLES1  0  2 16  0  0  6  0
+rs10813766 9    331490    331490 + ENSG00000107099 DOCK8  0  2  9  0  0  3  0
+rs4246215 11  61796827  61796827 + ENSG00000134824,ENSG00000168496 FADS2,FEN1  2  0  4  0  0  0  0
+rs1668871 1 205268009 205268009 + ENSG00000133069 TMCC2  0  0 18  0  0  8  0
+rs399604 6  33007237  33007237 + ENSG00000204252 HLA-DOA  0  0  2  0  1  1  0
+rs10512627 3 124621375 124621375 + ENSG00000160145 KALRN  0  0  6  0  0  2  0
+rs3731211 9  21986848  21986848 + ENSG00000147889,ENSG00000264545 CDKN2A,AL359922.1  0  1  6  0  0  0  0
+rs2297067 14 103100448 103100448 + ENSG00000205436 EXOC3L4  0  0  0  2  0  0  0
+rs8109288 19  16074749  16074749 + ENSG00000167460,ENSG00000279198 TPM4,AC008894.3  0  0  4  0  1  0  0
+rs4148441 13  95245953  95245953 + ENSG00000125257 ABCC4  0  4 12  0  0  2  0
+rs397969 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs4521516 5  88804134  88804134 + ENSG00000081189 MEF2C  0  0 31  0  0  3  0
+rs7342306 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs441460 6  25548060  25548060 + ENSG00000079691 CARMIL1  0  1  2  0  0  0  0
+rs559972 17  29487478  29487478 + ENSG00000160551 TAOK1  0  0  3  0  0  1  0
+rs6993770 8 105569300 105569300 + ENSG00000169946 ZFPM2  0  0  6  0  0  2  0
+rs1719271 15  64891602  64891602 + ENSG00000249240 AC069368.1  0  0  2  0  0  1  0
+rs409801 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs7550918 1 247512257 247512257 + ENSG00000169224 GCSAML  0  0  6  0  0  0  0
+rs6065 17   4933086   4933086 + ENSG00000185245 GP1BA  0  0  1  2  0  0  0
+rs8006385 14  93034681  93034681 + ENSG00000100605 ITPK1  0  0 11  0  0  3  0
+rs17568628 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs17030845 2  43460740  43460740 + ENSG00000115970 THADA  0  3  8  0  0  2  0
+rs17356664 19  45237513  45237513 + ENSG00000007047,ENSG00000283632 MARK4,EXOC3L2  0  0  2  0  0  0  0
+rs3819299 6  31354590  31354590 + ENSG00000234745 HLA-B  0  0  5  0  1  1  0
+rs13042885 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs7317038 13 113358583 113358583 + ENSG00000139835,ENSG00000225083 GRTP1,GRTP1-AS1  0  0  4  0  0  1  0
+rs10076782 5 159177955 159177955 + ENSG00000145860 RNF145  0  0  7  0  0  0  0
+rs2070729 5 132484229 132484229 + ENSG00000125347,ENSG00000197536,ENSG00000283782 IRF1,C5orf56,AC116366.3  0  0  9  0  1  3  0
+rs12969657 18  69869260  69869260 + ENSG00000150637 CD226  0  1  5  0  0  0  0
+rs3809566 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs4731120 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs6995402 8 143931393 143931393 + ENSG00000178209 PLEC  0  0 10  0  0  0  0
+rs625132 2  31259434  31259434 + ENSG00000013016 EHD3  0  0  1  0  0  0  0
+rs16971217 17  35617036  35617036 + ENSG00000006125 AP2B1  0  1 11  0  0  1  0
+rs17655730 NA NA NA NA NA NA NA NA NA NA NA NA NA
+rs649729 2  31241519  31241519 + ENSG00000013016 EHD3  0  0  2  0  0  0  0
+rs8076739 17  29387569  29387569 + ENSG00000264808,ENSG00000266111 AC068025.1,AC068025.2  0  0  2  0  0  2  0
+rs3811444 1 247876149 247876149 + ENSG00000162722 TRIM58  0  0  0  1  0  0  0
+rs6141 3 184372478 184372478 + ENSG00000090534 THPO 12  0  0  0  0  0  0
+rs10914144 1 171980610 171980610 + ENSG00000197959 DNM3  0  0  6  0  0  0  0
+rs3000073 14 105263455 105263455 + ENSG00000185024 BRF1  0  0  8  0  0  0  0
+rs9399137 6 135097880 135097880 + ENSG00000112339 HBS1L  0  0  1  0  0  0  0
+rs210134 6  33572432  33572432 + ENSG00000204188 GGNBP1  0  0  1  0  0  1  0
+rs3792366 3 123121029 123121029 + ENSG00000065485 PDIA5  0  2  4  0  0  0  0
+rs4938642 11 119229196 119229196 + ENSG00000110395 CBL  0  0  5  0  0  0  0
+rs2227831 5  76727669  76727669 + ENSG00000181104 F2R  0  0  1  0  0  0  0
+rs1034566 22  19996754  19996754 + ENSG00000099889 ARVCF  0  0  4  0  0  2  0
+rs941207 12  56629500  56629500 + ENSG00000076108 BAZ2A  0  0  7  0  0  2  0
b
diff -r 000000000000 -r 89cf0828d89d test-data/example_snpense_results_2.txt
--- /dev/null Thu Jan 01 00:00:00 1970 +0000
+++ b/test-data/example_snpense_results_2.txt Thu Nov 14 06:00:14 2019 -0500
b
@@ -0,0 +1,60 @@
+rs_id chromosome start end strand ensgs gene_names 3_prime_UTR_variant NMD_transcript_variant intron_variant missense_variant non_coding_transcript_exon_variant non_coding_transcript_variant splice_region_variant
+rs7961894 12 121927677 121927677 + ENSG00000158023 WDR66  0  0  3  0  0  1  0
+rs4305276 2 240555596 240555596 + ENSG00000144504 ANKMY1  0  0 57  0  0 18  0
+rs17396340 1  10226118  10226118 + ENSG00000054523 KIF1B  0  0  8  0  0  0  0
+rs944002 14 103106478 103106478 + ENSG00000205436 EXOC3L4  0  1  3  0  0  1  0
+rs7694379 4  87265357  87265357 + ENSG00000250572 AC108516.1  0  0  1  0  0  1  0
+rs3184504 12 111446804 111446804 + ENSG00000111252,ENSG00000204842 SH2B3,ATXN2  0  3  3 12  0  0  0
+rs700585 5  88856300  88856300 + ENSG00000081189 MEF2C  0  0 44  0  0  6  0
+rs7641175 3  18269920  18269920 + ENSG00000131374 TBC1D5  0  0  1  0  0  1  0
+rs1260326 2  27508073  27508073 + ENSG00000084734 GCKR  0  0  0  2  1  0  3
+rs342275 7 106718770 106718770 + ENSG00000243797 AC004917.1  0  0  2  0  0  2  0
+rs2336384 1  11986006  11986006 + ENSG00000116688 MFN2  0  0  7  0  0  3  0
+rs8022206 14  68054189  68054189 + ENSG00000182185 RAD51B  0  1 14  0  0  9  0
+rs1354034 3  56815721  56815721 + ENSG00000163947 ARHGEF3  0  2 10  0  0  3  0
+rs10761731 10  63267850  63267850 + ENSG00000171988 JMJD1C  0  0  6  0  0  4  0
+rs11789898 9 134060541 134060541 + ENSG00000169925 BRD3  0  0  2  0  0  0  0
+rs7075195 10  63290899  63290899 + ENSG00000171988 JMJD1C  0  0  2  0  0  1  0
+rs2015599 12  29282547  29282547 + ENSG00000064763,ENSG00000257176 FAR2,AC009318.1  0  1  7  0  0  2  0
+rs13300663 9   4814948   4814948 + ENSG00000120158 RCL1  0  0  8  0  0  2  0
+rs11082304 18  23141009  23141009 + ENSG00000134508 CABLES1  0  2 16  0  0  6  0
+rs10813766 9    331490    331490 + ENSG00000107099 DOCK8  0  2  9  0  0  3  0
+rs4246215 11  61796827  61796827 + ENSG00000134824,ENSG00000168496 FADS2,FEN1  2  0  4  0  0  0  0
+rs1668871 1 205268009 205268009 + ENSG00000133069 TMCC2  0  0 18  0  0  8  0
+rs399604 6  33007237  33007237 + ENSG00000204252 HLA-DOA  0  0  2  0  1  1  0
+rs10512627 3 124621375 124621375 + ENSG00000160145 KALRN  0  0  6  0  0  2  0
+rs3731211 9  21986848  21986848 + ENSG00000147889,ENSG00000264545 CDKN2A,AL359922.1  0  1  6  0  0  0  0
+rs2297067 14 103100448 103100448 + ENSG00000205436 EXOC3L4  0  0  0  2  0  0  0
+rs8109288 19  16074749  16074749 + ENSG00000167460,ENSG00000279198 TPM4,AC008894.3  0  0  4  0  1  0  0
+rs4148441 13  95245953  95245953 + ENSG00000125257 ABCC4  0  4 12  0  0  2  0
+rs4521516 5  88804134  88804134 + ENSG00000081189 MEF2C  0  0 31  0  0  3  0
+rs441460 6  25548060  25548060 + ENSG00000079691 CARMIL1  0  1  2  0  0  0  0
+rs559972 17  29487478  29487478 + ENSG00000160551 TAOK1  0  0  3  0  0  1  0
+rs6993770 8 105569300 105569300 + ENSG00000169946 ZFPM2  0  0  6  0  0  2  0
+rs1719271 15  64891602  64891602 + ENSG00000249240 AC069368.1  0  0  2  0  0  1  0
+rs7550918 1 247512257 247512257 + ENSG00000169224 GCSAML  0  0  6  0  0  0  0
+rs6065 17   4933086   4933086 + ENSG00000185245 GP1BA  0  0  1  2  0  0  0
+rs8006385 14  93034681  93034681 + ENSG00000100605 ITPK1  0  0 11  0  0  3  0
+rs17030845 2  43460740  43460740 + ENSG00000115970 THADA  0  3  8  0  0  2  0
+rs17356664 19  45237513  45237513 + ENSG00000007047,ENSG00000283632 MARK4,EXOC3L2  0  0  2  0  0  0  0
+rs3819299 6  31354590  31354590 + ENSG00000234745 HLA-B  0  0  5  0  1  1  0
+rs7317038 13 113358583 113358583 + ENSG00000139835,ENSG00000225083 GRTP1,GRTP1-AS1  0  0  4  0  0  1  0
+rs10076782 5 159177955 159177955 + ENSG00000145860 RNF145  0  0  7  0  0  0  0
+rs2070729 5 132484229 132484229 + ENSG00000125347,ENSG00000197536,ENSG00000283782 IRF1,C5orf56,AC116366.3  0  0  9  0  1  3  0
+rs12969657 18  69869260  69869260 + ENSG00000150637 CD226  0  1  5  0  0  0  0
+rs6995402 8 143931393 143931393 + ENSG00000178209 PLEC  0  0 10  0  0  0  0
+rs625132 2  31259434  31259434 + ENSG00000013016 EHD3  0  0  1  0  0  0  0
+rs16971217 17  35617036  35617036 + ENSG00000006125 AP2B1  0  1 11  0  0  1  0
+rs649729 2  31241519  31241519 + ENSG00000013016 EHD3  0  0  2  0  0  0  0
+rs8076739 17  29387569  29387569 + ENSG00000264808,ENSG00000266111 AC068025.1,AC068025.2  0  0  2  0  0  2  0
+rs3811444 1 247876149 247876149 + ENSG00000162722 TRIM58  0  0  0  1  0  0  0
+rs6141 3 184372478 184372478 + ENSG00000090534 THPO 12  0  0  0  0  0  0
+rs10914144 1 171980610 171980610 + ENSG00000197959 DNM3  0  0  6  0  0  0  0
+rs3000073 14 105263455 105263455 + ENSG00000185024 BRF1  0  0  8  0  0  0  0
+rs9399137 6 135097880 135097880 + ENSG00000112339 HBS1L  0  0  1  0  0  0  0
+rs210134 6  33572432  33572432 + ENSG00000204188 GGNBP1  0  0  1  0  0  1  0
+rs3792366 3 123121029 123121029 + ENSG00000065485 PDIA5  0  2  4  0  0  0  0
+rs4938642 11 119229196 119229196 + ENSG00000110395 CBL  0  0  5  0  0  0  0
+rs2227831 5  76727669  76727669 + ENSG00000181104 F2R  0  0  1  0  0  0  0
+rs1034566 22  19996754  19996754 + ENSG00000099889 ARVCF  0  0  4  0  0  2  0
+rs941207 12  56629500  56629500 + ENSG00000076108 BAZ2A  0  0  7  0  0  2  0