jbrowse2dev: jbrowse2/jbrowse2.py annotate

annotate jbrowse2/jbrowse2.py @ 5:42ca8804cd93 draft

urls in minimal, bloat in complete

author	fubar
date	Thu, 04 Jan 2024 02:18:18 +0000
parents	22e3d068fdc9
children	88b9b105c09b

rev	line source
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	1 #!/usr/bin/env python
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	2 # change to accumulating all configuration for config.json based on the default from the clone
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	3 import argparse
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	4 import datetime
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	5 import hashlib
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	6 import json
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	7 import logging
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	8 import os
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	9 import shutil
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	10 import subprocess
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	11 import tempfile
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	12 import xml.etree.ElementTree as ET
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	13 from collections import defaultdict
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	14
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	15 logging.basicConfig(level=logging.INFO)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	16 log = logging.getLogger("jbrowse")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	17 TODAY = datetime.datetime.now().strftime("%Y-%m-%d")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	18 GALAXY_INFRASTRUCTURE_URL = None
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	19 mapped_chars = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	20 ">": "__gt__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	21 "<": "__lt__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	22 "'": "__sq__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	23 '"': "__dq__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	24 "[": "__ob__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	25 "]": "__cb__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	26 "{": "__oc__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	27 "}": "__cc__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	28 "@": "__at__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	29 "#": "__pd__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	30 "": "__cn__",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	31 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	32
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	33
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	34 def etree_to_dict(t):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	35 if t is None:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	36 return {}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	37
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	38 d = {t.tag: {} if t.attrib else None}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	39 children = list(t)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	40 if children:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	41 dd = defaultdict(list)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	42 for dc in map(etree_to_dict, children):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	43 for k, v in dc.items():
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	44 dd[k].append(v)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	45 d = {t.tag: {k: v[0] if len(v) == 1 else v for k, v in dd.items()}}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	46 if t.attrib:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	47 d[t.tag].update(("@" + k, v) for k, v in t.attrib.items())
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	48 if t.text:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	49 text = t.text.strip()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	50 if children or t.attrib:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	51 if text:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	52 d[t.tag]["#text"] = text
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	53 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	54 d[t.tag] = text
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	55 return d
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	56
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	57
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	58 INSTALLED_TO = os.path.dirname(os.path.realpath(__file__))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	59
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	60
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	61 def metadata_from_node(node):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	62 metadata = {}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	63 try:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	64 if len(node.findall("dataset")) != 1:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	65 # exit early
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	66 return metadata
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	67 except Exception:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	68 return {}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	69
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	70 for (key, value) in node.findall("dataset")[0].attrib.items():
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	71 metadata["dataset_%s" % key] = value
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	72
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	73 for (key, value) in node.findall("history")[0].attrib.items():
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	74 metadata["history_%s" % key] = value
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	75
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	76 for (key, value) in node.findall("metadata")[0].attrib.items():
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	77 metadata["metadata_%s" % key] = value
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	78
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	79 for (key, value) in node.findall("tool")[0].attrib.items():
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	80 metadata["tool_%s" % key] = value
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	81
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	82 # Additional Mappings applied:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	83 metadata[
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	84 "dataset_edam_format"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	85 ] = '<a target="_blank" href="http://edamontology.org/{0}">{1}</a>'.format(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	86 metadata["dataset_edam_format"], metadata["dataset_file_ext"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	87 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	88 metadata["history_user_email"] = '<a href="mailto:{0}">{0}</a>'.format(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	89 metadata["history_user_email"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	90 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	91 metadata["hist_name"] = metadata["history_display_name"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	92 metadata[
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	93 "history_display_name"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	94 ] = '<a target="_blank" href="{galaxy}/history/view/{encoded_hist_id}">{hist_name}</a>'.format(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	95 galaxy=GALAXY_INFRASTRUCTURE_URL,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	96 encoded_hist_id=metadata["history_id"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	97 hist_name=metadata["history_display_name"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	98 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	99 metadata[
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	100 "tool_tool"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	101 ] = '<a target="_blank" href="{galaxy}/datasets/{encoded_id}/show_params">{tool_id}</a>'.format(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	102 galaxy=GALAXY_INFRASTRUCTURE_URL,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	103 encoded_id=metadata["dataset_id"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	104 tool_id=metadata["tool_tool_id"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	105 # tool_version=metadata['tool_tool_version'],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	106 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	107 return metadata
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	108
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	109
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	110 class JbrowseConnector(object):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	111 def __init__(self, jbrowse, outdir, genomes, standalone=None):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	112 self.debug = False
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	113 self.giURL = GALAXY_INFRASTRUCTURE_URL
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	114 self.jbrowse = jbrowse
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	115 self.outdir = outdir
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	116 os.makedirs(self.outdir, exist_ok=True)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	117 self.genome_paths = genomes
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	118 self.standalone = standalone
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	119 self.trackIdlist = []
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	120 self.tracksToAdd = []
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	121 self.config_json = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	122 "configuration": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	123 "rpc": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	124 "defaultDriver": "WebWorkerRpcDriver",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	125 "drivers": {"MainThreadRpcDriver": {}, "WebWorkerRpcDriver": {}},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	126 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	127 "logoPath": {"locationType": "UriLocation", "uri": ""},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	128 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	129 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	130 self.config_json_file = os.path.join(outdir, "config.json")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	131 if standalone == "complete":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	132 self.clone_jbrowse(self.jbrowse, self.outdir)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	133 elif standalone == "minimal":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	134 self.clone_jbrowse(self.jbrowse, self.outdir, minimal=True)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	135
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	136 def subprocess_check_call(self, command, output=None):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	137 if output:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	138 if self.debug:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	139 log.debug("cd %s && %s > %s", self.outdir, " ".join(command), output)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	140 subprocess.check_call(command, cwd=self.outdir, stdout=output)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	141 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	142 log.debug("cd %s && %s", self.outdir, " ".join(command))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	143 subprocess.check_call(command, cwd=self.outdir)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	144
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	145 def subprocess_popen(self, command):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	146 if self.debug:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	147 log.debug("cd %s && %s", self.outdir, command)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	148 p = subprocess.Popen(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	149 command,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	150 shell=True,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	151 stdin=subprocess.PIPE,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	152 stdout=subprocess.PIPE,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	153 stderr=subprocess.PIPE,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	154 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	155 output, err = p.communicate()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	156 retcode = p.returncode
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	157 if retcode != 0:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	158 log.error("cd %s && %s", self.outdir, command)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	159 log.error(output)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	160 log.error(err)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	161 raise RuntimeError("Command failed with exit code %s" % (retcode))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	162
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	163 def subprocess_check_output(self, command):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	164 if self.debug:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	165 log.debug("cd %s && %s", self.outdir, " ".join(command))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	166 return subprocess.check_output(command, cwd=self.outdir)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	167
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	168 def _jbrowse_bin(self, command):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	169 return os.path.realpath(os.path.join(self.jbrowse, "bin", command))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	170
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	171 def symlink_or_copy(self, src, dest):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	172 if "GALAXY_JBROWSE_SYMLINKS" in os.environ and bool(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	173 os.environ["GALAXY_JBROWSE_SYMLINKS"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	174 ):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	175 cmd = ["ln", "-s", src, dest]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	176 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	177 cmd = ["cp", src, dest]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	178
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	179 return self.subprocess_check_call(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	180
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	181 def process_genomes(self):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	182 assemblies = []
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	183 for i, genome_node in enumerate(self.genome_paths):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	184 log.info("genome_node=%s" % str(genome_node))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	185 # We only expect one input genome per run. This for loop is just
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	186 # easier to write than the alternative / catches any possible
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	187 # issues.
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	188 genome_name = genome_node["meta"]["dataset_dname"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	189 dsId = genome_node["meta"]["dataset_id"]
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	190 fapath = genome_node["path"]
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	191 faname = genome_name + ".fasta"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	192 faind = os.path.realpath(os.path.join(self.outdir, faname + ".fai"))
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	193 if self.standalone == "complete":
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	194 faurl = faname
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	195 fadest = os.path.realpath(os.path.join(self.outdir, faname))
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	196 cmd = ["cp", fapath, fadest]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	197 self.subprocess_check_call(cmd)
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	198 else:
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	199 faurl = "%s/api/datasets/%s/display?to_ext=fasta" % (self.giURL, dsId)
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	200 cmd = ["samtools", "faidx", fapath, "--fai-idx", faind]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	201 self.subprocess_check_call(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	202 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	203 "name": genome_name,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	204 "sequence": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	205 "type": "ReferenceSequenceTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	206 "trackId": genome_name,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	207 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	208 "type": "IndexedFastaAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	209 "fastaLocation": {"uri": faurl, "locationType": "UriLocation"},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	210 "faiLocation": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	211 "uri": faname + ".fai",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	212 "locationType": "UriLocation",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	213 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	214 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	215 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	216 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	217 assemblies.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	218 self.config_json["assemblies"] = assemblies
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	219 self.genome_name = genome_name
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	220 self.genome_path = faurl
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	221 self.genome_fai_path = faname + ".fai"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	222
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	223 def add_default_view(self):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	224 cmd = [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	225 "jbrowse",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	226 "set-default-session",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	227 "-s",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	228 self.config_json_file,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	229 "-t",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	230 ",".join(self.trackIdlist),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	231 "-n",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	232 "Default",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	233 "--target",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	234 self.outdir,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	235 ] #
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	236 self.subprocess_check_call(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	237
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	238 def write_config(self):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	239 with open(self.config_json_file, "w") as fp:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	240 json.dump(self.config_json, fp)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	241
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	242 def add_hic(self, data, trackData):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	243 """
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	244 HiC adapter.
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	245 https://github.com/aidenlab/hic-format/blob/master/HiCFormatV9.md
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	246 for testing locally, these work:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	247 HiC data is from https://s3.amazonaws.com/igv.broadinstitute.org/data/hic/intra_nofrag_30.hic
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	248 using hg19 reference track as a
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	249 'BgzipFastaAdapter'
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	250 fastaLocation:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	251 uri: 'https://s3.amazonaws.com/jbrowse.org/genomes/GRCh38/fasta/GRCh38.fa.gz',
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	252 faiLocation:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	253 uri: 'https://s3.amazonaws.com/jbrowse.org/genomes/GRCh38/fasta/GRCh38.fa.gz.fai',
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	254 gziLocation:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	255 uri: 'https://s3.amazonaws.com/jbrowse.org/genomes/GRCh38/fasta/GRCh38.fa.gz.gzi',
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	256 Cool will not be likely to be a good fit - see discussion at https://github.com/GMOD/jbrowse-components/issues/2438
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	257 """
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	258 log.info("#### trackData=%s" % trackData)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	259 tId = trackData["label"]
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	260 dsId = trackData["metadata"]["dataset_id"]
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	261 url = "%s/api/datasets/%s/display?to_ext=hic " % (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	262 self.giURL,
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	263 dsId,
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	264 )
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	265 hname = trackData["name"]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	266 if self.standalone == "complete":
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	267 dest = os.path.realpath(os.path.join(self.outdir, hname))
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	268 url = hname
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	269 cmd = ["cp", data, dest]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	270 self.subprocess_check_call(cmd)
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	271 else:
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	272 url = "%s/api/datasets/%s/display?to_ext=hic" % (self.giURL, dsId)
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	273 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	274 "type": "HicTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	275 "trackId": tId,
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	276 "name": hname,
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	277 "assemblyNames": [self.genome_name],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	278 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	279 "type": "HicAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	280 "hicLocation": {"uri": url, "locationType": "UriLocation"},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	281 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	282 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	283 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	284 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	285
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	286 def add_maf(self, data, trackData):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	287 """
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	288 from https://github.com/cmdcolin/maf2bed
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	289 Note: Both formats start with a MAF as input, and note that your MAF file should contain the species name and chromosome name
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	290 e.g. hg38.chr1 in the sequence identifiers.
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	291 need the reference id - eg hg18, for maf2bed.pl as the first parameter
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	292 """
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	293 mafPlugin = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	294 "plugins": [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	295 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	296 "name": "MafViewer",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	297 "url": "https://unpkg.com/jbrowse-plugin-mafviewer/dist/jbrowse-plugin-mafviewer.umd.production.min.js",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	298 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	299 ]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	300 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	301 tId = trackData["label"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	302 fname = "%s.bed" % tId
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	303 dest = os.path.realpath("%s/%s" % (self.outdir, fname))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	304 # self.symlink_or_copy(data, dest)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	305 # Process MAF to bed-like. Need build to munge chromosomes
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	306 gname = self.genome_name
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	307 cmd = [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	308 "bash",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	309 os.path.join(INSTALLED_TO, "convertMAF.sh"),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	310 data,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	311 gname,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	312 INSTALLED_TO,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	313 dest,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	314 ]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	315 self.subprocess_check_call(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	316 if True or self.debug:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	317 log.info("### convertMAF.sh called as %s" % " ".join(cmd))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	318 # Construct samples list
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	319 # We could get this from galaxy metadata, not sure how easily.
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	320 ps = subprocess.Popen(["grep", "^s [^ ]*", "-o", data], stdout=subprocess.PIPE)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	321 output = subprocess.check_output(("sort", "-u"), stdin=ps.stdout)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	322 ps.wait()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	323 outp = output.decode("ascii")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	324 soutp = outp.split("\n")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	325 samp = [x.split("s ")[1] for x in soutp if x.startswith("s ")]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	326 samples = [x.split(".")[0] for x in samp]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	327 if self.debug:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	328 log.info("### got samples = %s " % (samples))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	329 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	330 "type": "MafTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	331 "trackId": tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	332 "name": trackData["name"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	333 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	334 "type": "MafTabixAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	335 "samples": samples,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	336 "bedGzLocation": {"uri": fname + ".sorted.bed.gz"},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	337 "index": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	338 "location": {"uri": fname + ".sorted.bed.gz.tbi"},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	339 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	340 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	341 "assemblyNames": [self.genome_name],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	342 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	343 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	344 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	345 if self.config_json.get("plugins", None):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	346 self.config_json["plugins"].append(mafPlugin[0])
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	347 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	348 self.config_json.update(mafPlugin)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	349
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	350 def _blastxml_to_gff3(self, xml, min_gap=10):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	351 gff3_unrebased = tempfile.NamedTemporaryFile(delete=False)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	352 cmd = [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	353 "python",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	354 os.path.join(INSTALLED_TO, "blastxml_to_gapped_gff3.py"),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	355 "--trim",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	356 "--trim_end",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	357 "--include_seq",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	358 "--min_gap",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	359 str(min_gap),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	360 xml,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	361 ]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	362 subprocess.check_call(cmd, cwd=self.outdir, stdout=gff3_unrebased)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	363 gff3_unrebased.close()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	364 return gff3_unrebased.name
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	365
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	366 def add_blastxml(self, data, trackData, blastOpts, **kwargs):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	367 gff3 = self._blastxml_to_gff3(data, min_gap=blastOpts["min_gap"])
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	368
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	369 if "parent" in blastOpts and blastOpts["parent"] != "None":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	370 gff3_rebased = tempfile.NamedTemporaryFile(delete=False)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	371 cmd = ["python", os.path.join(INSTALLED_TO, "gff3_rebase.py")]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	372 if blastOpts.get("protein", "false") == "true":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	373 cmd.append("--protein2dna")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	374 cmd.extend([os.path.realpath(blastOpts["parent"]), gff3])
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	375 subprocess.check_call(cmd, cwd=self.outdir, stdout=gff3_rebased)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	376 gff3_rebased.close()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	377
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	378 # Replace original gff3 file
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	379 shutil.copy(gff3_rebased.name, gff3)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	380 os.unlink(gff3_rebased.name)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	381 url = "%s.gff3" % trackData["label"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	382 dest = os.path.realpath("%s/%s" % (self.outdir, url))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	383 self._sort_gff(gff3, dest)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	384 url = url + ".gz"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	385 tId = trackData["label"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	386 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	387 "type": "FeatureTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	388 "trackId": tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	389 "name": trackData["name"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	390 "assemblyNames": [self.genome_name],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	391 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	392 "type": "Gff3TabixAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	393 "gffGzLocation": {"locationType": "UriLocation", "uri": url},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	394 "index": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	395 "location": {"locationType": "UriLocation", "uri": url + ".tbi"}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	396 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	397 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	398 "displays": [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	399 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	400 "type": "LinearBasicDisplay",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	401 "displayId": "%s-LinearBasicDisplay" % tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	402 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	403 {"type": "LinearArcDisplay", "displayId": "%s-LinearArcDisplay" % tId},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	404 ],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	405 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	406 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	407 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	408 os.unlink(gff3)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	409
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	410 def add_bigwig(self, data, trackData):
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	411 fname = trackData["name"]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	412 if self.standalone == "complete":
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	413 dest = os.path.realpath(os.path.join(self.outdir, fname))
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	414 url = fname
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	415 cmd = ["cp", data, dest]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	416 self.subprocess_check_call(cmd)
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	417 else:
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	418 dsId = trackData["metadata"]["dataset_id"]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	419 url = "%s/api/datasets/%s/display?to_ext=fasta" % (self.giURL, dsId)
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	420 tId = trackData["label"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	421 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	422 "type": "QuantitativeTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	423 "trackId": tId,
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	424 "name": fname,
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	425 "assemblyNames": [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	426 self.genome_name,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	427 ],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	428 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	429 "type": "BigWigAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	430 "bigWigLocation": {"locationType": "UriLocation", "uri": url},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	431 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	432 "displays": [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	433 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	434 "type": "LinearWiggleDisplay",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	435 "displayId": "%s-LinearWiggleDisplay" % tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	436 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	437 ],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	438 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	439 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	440 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	441
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	442 def add_bam(self, data, trackData, bamOpts, bam_index=None, **kwargs):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	443 tId = trackData["label"]
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	444 fname = "%s.bam" % trackData["label"]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	445 dest = os.path.realpath("%s/%s" % (self.outdir, fname))
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	446 if self.standalone == "minimal":
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	447 dsId = trackData["metadata"]["dataset_id"]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	448 url = "%s/api/datasets/%s/display?to_ext=bam" % (self.giURL, dsId)
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	449 else:
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	450 url = fname
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	451 self.symlink_or_copy(data, dest)
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	452 if bam_index is not None and os.path.exists(os.path.realpath(bam_index)):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	453 # bai most probably made by galaxy and stored in galaxy dirs, need to copy it to dest
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	454 self.subprocess_check_call(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	455 ["cp", os.path.realpath(bam_index), dest + ".bai"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	456 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	457 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	458 # Can happen in exotic condition
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	459 # e.g. if bam imported as symlink with datatype=unsorted.bam, then datatype changed to bam
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	460 # => no index generated by galaxy, but there might be one next to the symlink target
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	461 # this trick allows to skip the bam sorting made by galaxy if already done outside
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	462 if os.path.exists(os.path.realpath(data) + ".bai"):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	463 self.symlink_or_copy(os.path.realpath(data) + ".bai", dest + ".bai")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	464 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	465 log.warn("Could not find a bam index (.bai file) for %s", data)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	466 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	467 "type": "AlignmentsTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	468 "trackId": tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	469 "name": trackData["name"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	470 "assemblyNames": [self.genome_name],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	471 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	472 "type": "BamAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	473 "bamLocation": {"locationType": "UriLocation", "uri": url},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	474 "index": {
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	475 "location": {"locationType": "UriLocation", "uri": fname + ".bai"}
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	476 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	477 "sequenceAdapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	478 "type": "IndexedFastaAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	479 "fastaLocation": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	480 "locationType": "UriLocation",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	481 "uri": self.genome_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	482 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	483 "faiLocation": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	484 "locationType": "UriLocation",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	485 "uri": self.genome_fai_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	486 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	487 "metadataLocation": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	488 "locationType": "UriLocation",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	489 "uri": "/path/to/fa.metadata.yaml",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	490 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	491 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	492 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	493 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	494 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	495 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	496
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	497 def add_vcf(self, data, trackData):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	498 tId = trackData["label"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	499 url = "%s/api/datasets/%s/display" % (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	500 self.giURL,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	501 trackData["metadata"]["dataset_id"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	502 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	503 url = "%s.vcf.gz" % tId
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	504 dest = os.path.realpath("%s/%s" % (self.outdir, url))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	505 cmd = "bgzip -c %s > %s" % (data, dest)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	506 self.subprocess_popen(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	507 cmd = ["tabix", "-p", "vcf", dest]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	508 self.subprocess_check_call(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	509 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	510 "type": "VariantTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	511 "trackId": tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	512 "name": trackData["name"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	513 "assemblyNames": [self.genome_name],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	514 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	515 "type": "VcfTabixAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	516 "vcfGzLocation": {"uri": url, "locationType": "UriLocation"},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	517 "index": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	518 "location": {"uri": url + ".tbi", "locationType": "UriLocation"}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	519 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	520 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	521 "displays": [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	522 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	523 "type": "LinearVariantDisplay",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	524 "displayId": "%s-LinearVariantDisplay" % tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	525 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	526 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	527 "type": "ChordVariantDisplay",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	528 "displayId": "%s-ChordVariantDisplay" % tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	529 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	530 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	531 "type": "LinearPairedArcDisplay",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	532 "displayId": "%s-LinearPairedArcDisplay" % tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	533 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	534 ],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	535 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	536 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	537 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	538
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	539 def _sort_gff(self, data, dest):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	540 # Only index if not already done
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	541 if not os.path.exists(dest + ".gz"):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	542 cmd = "jbrowse sort-gff %s \| bgzip -c > %s.gz" % (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	543 data,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	544 dest,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	545 ) # "gff3sort.pl --precise '%s' \| grep -v \"^$\" > '%s'"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	546 self.subprocess_popen(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	547 self.subprocess_check_call(["tabix", "-f", "-p", "gff", dest + ".gz"])
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	548
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	549 def _sort_bed(self, data, dest):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	550 # Only index if not already done
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	551 if not os.path.exists(dest):
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	552 cmd = "sort -k1,1 -k2,2n %s \| bgzip -c > %s" % (data, dest)
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	553 self.subprocess_popen(cmd)
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	554 cmd = ["tabix", "-f", "-p", "bed", dest]
42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	555 self.subprocess_check_call(cmd)
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	556
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	557 def add_gff(self, data, ext, trackData):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	558 url = "%s.%s" % (trackData["label"], ext)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	559 dest = os.path.realpath("%s/%s" % (self.outdir, url))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	560 self._sort_gff(data, dest)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	561 url = url + ".gz"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	562 tId = trackData["label"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	563 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	564 "type": "FeatureTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	565 "trackId": tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	566 "name": trackData["name"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	567 "assemblyNames": [self.genome_name],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	568 "adapter": {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	569 "type": "Gff3TabixAdapter",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	570 "gffGzLocation": {"locationType": "UriLocation", "uri": url},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	571 "index": {
2 22e3d068fdc9 Uploaded fubar parents: 0 diff changeset	572 "location": {"uri": url + ".tbi", "locationType": "UriLocation"}
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	573 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	574 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	575 "displays": [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	576 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	577 "type": "LinearBasicDisplay",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	578 "displayId": "%s-LinearBasicDisplay" % tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	579 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	580 {"type": "LinearArcDisplay", "displayId": "%s-LinearArcDisplay" % tId},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	581 ],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	582 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	583 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	584 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	585
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	586 def add_bed(self, data, ext, trackData):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	587 url = "%s.%s" % (trackData["label"], ext)
5 42ca8804cd93 urls in minimal, bloat in complete fubar parents: 2 diff changeset	588 dest = os.path.realpath("%s/%s.gz" % (self.outdir, url))
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	589 self._sort_bed(data, dest)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	590 tId = trackData["label"]
2 22e3d068fdc9 Uploaded fubar parents: 0 diff changeset	591 url = url + ".gz"
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	592 trackDict = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	593 "type": "FeatureTrack",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	594 "trackId": tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	595 "name": trackData["name"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	596 "assemblyNames": [self.genome_name],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	597 "adapter": {
2 22e3d068fdc9 Uploaded fubar parents: 0 diff changeset	598 "type": "BedTabixAdapter",
22e3d068fdc9 Uploaded fubar parents: 0 diff changeset	599 "bedGzLocation": {"locationType": "UriLocation", "uri": url},
22e3d068fdc9 Uploaded fubar parents: 0 diff changeset	600 "index": {
22e3d068fdc9 Uploaded fubar parents: 0 diff changeset	601 "location": {"uri": url + ".tbi", "locationType": "UriLocation"}
22e3d068fdc9 Uploaded fubar parents: 0 diff changeset	602 },
0 cd5d63cd0eb5 Uploaded fubar parents: diff changeset	603 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	604 "displays": [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	605 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	606 "type": "LinearBasicDisplay",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	607 "displayId": "%s-LinearBasicDisplay" % tId,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	608 },
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	609 {"type": "LinearArcDisplay", "displayId": "%s-LinearArcDisplay" % tId},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	610 ],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	611 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	612 self.tracksToAdd.append(trackDict)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	613 self.trackIdlist.append(tId)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	614
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	615 def process_annotations(self, track):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	616 category = track["category"].replace("__pd__date__pd__", TODAY)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	617 for i, (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	618 dataset_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	619 dataset_ext,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	620 track_human_label,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	621 extra_metadata,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	622 ) in enumerate(track["trackfiles"]):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	623 # Unsanitize labels (element_identifiers are always sanitized by Galaxy)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	624 for key, value in mapped_chars.items():
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	625 track_human_label = track_human_label.replace(value, key)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	626 outputTrackConfig = {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	627 "category": category,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	628 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	629 if self.debug:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	630 log.info(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	631 "Processing category = %s, track_human_label = %s",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	632 category,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	633 track_human_label,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	634 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	635 # We add extra data to hash for the case of REST + SPARQL.
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	636 if (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	637 "conf" in track
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	638 and "options" in track["conf"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	639 and "url" in track["conf"]["options"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	640 ):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	641 rest_url = track["conf"]["options"]["url"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	642 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	643 rest_url = ""
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	644
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	645 # I chose to use track['category'] instead of 'category' here. This
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	646 # is intentional. This way re-running the tool on a different date
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	647 # will not generate different hashes and make comparison of outputs
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	648 # much simpler.
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	649 hashData = [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	650 str(dataset_path),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	651 track_human_label,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	652 track["category"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	653 rest_url,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	654 ]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	655 hashData = "\|".join(hashData).encode("utf-8")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	656 outputTrackConfig["label"] = hashlib.md5(hashData).hexdigest() + "_%s" % i
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	657 outputTrackConfig["metadata"] = extra_metadata
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	658 outputTrackConfig["name"] = track_human_label
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	659
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	660 if dataset_ext in ("gff", "gff3"):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	661 self.add_gff(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	662 dataset_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	663 dataset_ext,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	664 outputTrackConfig,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	665 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	666 elif dataset_ext in ("hic",):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	667 self.add_hic(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	668 dataset_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	669 outputTrackConfig,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	670 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	671 elif dataset_ext in ("bed",):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	672 self.add_bed(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	673 dataset_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	674 dataset_ext,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	675 outputTrackConfig,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	676 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	677 elif dataset_ext in ("maf",):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	678 self.add_maf(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	679 dataset_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	680 outputTrackConfig,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	681 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	682 elif dataset_ext == "bigwig":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	683 self.add_bigwig(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	684 dataset_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	685 outputTrackConfig,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	686 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	687 elif dataset_ext == "bam":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	688 real_indexes = track["conf"]["options"]["pileup"]["bam_indices"][
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	689 "bam_index"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	690 ]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	691 if not isinstance(real_indexes, list):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	692 # <bam_indices>
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	693 # <bam_index>/path/to/a.bam.bai</bam_index>
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	694 # </bam_indices>
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	695 #
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	696 # The above will result in the 'bam_index' key containing a
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	697 # string. If there are two or more indices, the container
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	698 # becomes a list. Fun!
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	699 real_indexes = [real_indexes]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	700
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	701 self.add_bam(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	702 dataset_path,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	703 outputTrackConfig,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	704 track["conf"]["options"]["pileup"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	705 bam_index=real_indexes[i],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	706 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	707 elif dataset_ext == "blastxml":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	708 self.add_blastxml(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	709 dataset_path, outputTrackConfig, track["conf"]["options"]["blast"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	710 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	711 elif dataset_ext == "vcf":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	712 self.add_vcf(dataset_path, outputTrackConfig)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	713 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	714 log.warn("Do not know how to handle %s", dataset_ext)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	715
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	716 def clone_jbrowse(self, jbrowse_dir, destination, minimal=False):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	717 """Clone a JBrowse directory into a destination directory."""
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	718 cmd = ["jbrowse", "create", "-f", self.outdir]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	719 self.subprocess_check_call(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	720 for fn in [
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	721 "asset-manifest.json",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	722 "favicon.ico",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	723 "robots.txt",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	724 "umd_plugin.js",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	725 "version.txt",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	726 "test_data",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	727 ]:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	728 cmd = ["rm", "-rf", os.path.join(self.outdir, fn)]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	729 self.subprocess_check_call(cmd)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	730
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	731
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	732 if __name__ == "__main__":
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	733 parser = argparse.ArgumentParser(description="", epilog="")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	734 parser.add_argument("xml", type=argparse.FileType("r"), help="Track Configuration")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	735
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	736 parser.add_argument("--jbrowse", help="Folder containing a jbrowse release")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	737 parser.add_argument("--outdir", help="Output directory", default="out")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	738 parser.add_argument(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	739 "--standalone",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	740 choices=["complete", "minimal", "data"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	741 help="Standalone mode includes a copy of JBrowse",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	742 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	743 parser.add_argument("--version", "-V", action="version", version="%(prog)s 0.8.0")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	744 args = parser.parse_args()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	745
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	746 tree = ET.parse(args.xml.name)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	747 root = tree.getroot()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	748
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	749 # This should be done ASAP
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	750 GALAXY_INFRASTRUCTURE_URL = root.find("metadata/galaxyUrl").text
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	751 # Sometimes this comes as `localhost` without a protocol
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	752 if not GALAXY_INFRASTRUCTURE_URL.startswith("http"):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	753 # so we'll prepend `http://` and hope for the best. Requests should
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	754 # be GET and not POST so it should redirect OK
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	755 GALAXY_INFRASTRUCTURE_URL = "http://" + GALAXY_INFRASTRUCTURE_URL
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	756
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	757 jc = JbrowseConnector(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	758 jbrowse=args.jbrowse,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	759 outdir=args.outdir,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	760 genomes=[
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	761 {
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	762 "path": os.path.realpath(x.attrib["path"]),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	763 "meta": metadata_from_node(x.find("metadata")),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	764 }
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	765 for x in root.findall("metadata/genomes/genome")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	766 ],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	767 standalone=args.standalone,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	768 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	769 jc.process_genomes()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	770
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	771 for track in root.findall("tracks/track"):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	772 track_conf = {}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	773 track_conf["trackfiles"] = []
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	774
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	775 is_multi_bigwig = False
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	776 try:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	777 if track.find("options/wiggle/multibigwig") and (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	778 track.find("options/wiggle/multibigwig").text == "True"
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	779 ):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	780 is_multi_bigwig = True
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	781 multi_bigwig_paths = []
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	782 except KeyError:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	783 pass
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	784
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	785 trackfiles = track.findall("files/trackFile")
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	786 if trackfiles:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	787 for x in track.findall("files/trackFile"):
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	788 if is_multi_bigwig:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	789 multi_bigwig_paths.append(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	790 (x.attrib["label"], os.path.realpath(x.attrib["path"]))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	791 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	792 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	793 if trackfiles:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	794 metadata = metadata_from_node(x.find("metadata"))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	795 track_conf["dataset_id"] = metadata["dataset_id"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	796 track_conf["trackfiles"].append(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	797 (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	798 os.path.realpath(x.attrib["path"]),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	799 x.attrib["ext"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	800 x.attrib["label"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	801 metadata,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	802 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	803 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	804 else:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	805 # For tracks without files (rest, sparql)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	806 track_conf["trackfiles"].append(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	807 (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	808 "", # N/A, no path for rest or sparql
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	809 track.attrib["format"],
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	810 track.find("options/label").text,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	811 {},
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	812 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	813 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	814
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	815 if is_multi_bigwig:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	816 metadata = metadata_from_node(x.find("metadata"))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	817
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	818 track_conf["trackfiles"].append(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	819 (
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	820 multi_bigwig_paths, # Passing an array of paths to represent as one track
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	821 "bigwig_multiple",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	822 "MultiBigWig", # Giving an hardcoded name for now
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	823 {}, # No metadata for multiple bigwig
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	824 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	825 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	826
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	827 track_conf["category"] = track.attrib["cat"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	828 track_conf["format"] = track.attrib["format"]
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	829 try:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	830 # Only pertains to gff3 + blastxml. TODO?
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	831 track_conf["style"] = {t.tag: t.text for t in track.find("options/style")}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	832 except TypeError:
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	833 track_conf["style"] = {}
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	834 pass
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	835 track_conf["conf"] = etree_to_dict(track.find("options"))
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	836 jc.process_annotations(track_conf)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	837 print("## processed", str(track_conf), "trackIdlist", jc.trackIdlist)
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	838 print(
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	839 "###done processing, trackIdlist=",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	840 jc.trackIdlist,
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	841 "config=",
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	842 str(jc.config_json),
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	843 )
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	844 jc.config_json["tracks"] = jc.tracksToAdd
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	845 jc.write_config()
cd5d63cd0eb5 Uploaded fubar parents: diff changeset	846 jc.add_default_view()

Mercurial > repos > fubar > jbrowse2dev

annotate jbrowse2/jbrowse2.py @ 5:42ca8804cd93 draft