queue_genotype_workflow: queue_genotype

annotate queue_genotype_workflow.py @ 1:d00c4cc7e8c2 draft

Uploaded

author	greg
date	Mon, 19 Aug 2019 13:25:40 -0400
parents	c80fae8c94c1
children	163ecfba5961

rev	line source
0 c80fae8c94c1 Uploaded greg parents: diff changeset	1 #!/usr/bin/env python
c80fae8c94c1 Uploaded greg parents: diff changeset	2 import argparse
c80fae8c94c1 Uploaded greg parents: diff changeset	3 import os
c80fae8c94c1 Uploaded greg parents: diff changeset	4 import shutil
c80fae8c94c1 Uploaded greg parents: diff changeset	5 import string
c80fae8c94c1 Uploaded greg parents: diff changeset	6 import sys
c80fae8c94c1 Uploaded greg parents: diff changeset	7 import threading
c80fae8c94c1 Uploaded greg parents: diff changeset	8 import time
c80fae8c94c1 Uploaded greg parents: diff changeset	9
c80fae8c94c1 Uploaded greg parents: diff changeset	10 from bioblend import galaxy
1 d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	11 from datetime import datetime
0 c80fae8c94c1 Uploaded greg parents: diff changeset	12 from six.moves import configparser
c80fae8c94c1 Uploaded greg parents: diff changeset	13
c80fae8c94c1 Uploaded greg parents: diff changeset	14 parser = argparse.ArgumentParser()
c80fae8c94c1 Uploaded greg parents: diff changeset	15 parser.add_argument('--affy_metadata', dest='affy_metadata', help='Input Affymetrix 96 well plate metadata file')
c80fae8c94c1 Uploaded greg parents: diff changeset	16 parser.add_argument('--annot', dest='annot', help='Probeset annotation file')
c80fae8c94c1 Uploaded greg parents: diff changeset	17 parser.add_argument('--api_key', dest='api_key', help='Current user API key')
c80fae8c94c1 Uploaded greg parents: diff changeset	18 parser.add_argument('--calls', dest='calls', help='Apt-probeset genotype calls file')
c80fae8c94c1 Uploaded greg parents: diff changeset	19 parser.add_argument('--confidences', dest='confidences', help='Apt-probeset genotype confidences file')
c80fae8c94c1 Uploaded greg parents: diff changeset	20 parser.add_argument('--config_file', dest='config_file', help='qgw_config.ini')
c80fae8c94c1 Uploaded greg parents: diff changeset	21 parser.add_argument('--dbkey', dest='dbkey', help='Reference genome dbkey')
c80fae8c94c1 Uploaded greg parents: diff changeset	22 parser.add_argument('--reference_genome', dest='reference_genome', help='Reference genome')
c80fae8c94c1 Uploaded greg parents: diff changeset	23 parser.add_argument('--history_id', dest='history_id', help='Encoded id of current history')
c80fae8c94c1 Uploaded greg parents: diff changeset	24 parser.add_argument('--output', dest='output', help='Output dataset')
c80fae8c94c1 Uploaded greg parents: diff changeset	25 parser.add_argument('--report', dest='report', help='Apt-probeset genotype report file')
c80fae8c94c1 Uploaded greg parents: diff changeset	26 parser.add_argument('--sample_attributes', dest='sample_attributes', help='Sample attributes tabular file')
c80fae8c94c1 Uploaded greg parents: diff changeset	27 parser.add_argument('--snp-posteriors', dest='snp-posteriors', help='Apt-probeset genotype snp-posteriors file')
c80fae8c94c1 Uploaded greg parents: diff changeset	28 parser.add_argument('--summary', dest='summary', help='Apt-probeset genotype summary file')
c80fae8c94c1 Uploaded greg parents: diff changeset	29 args = parser.parse_args()
c80fae8c94c1 Uploaded greg parents: diff changeset	30
c80fae8c94c1 Uploaded greg parents: diff changeset	31
c80fae8c94c1 Uploaded greg parents: diff changeset	32 def add_library_dataset_to_history(gi, history_id, dataset_id, history_datasets, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	33 # Add a data library dataset to a history.
c80fae8c94c1 Uploaded greg parents: diff changeset	34 outputfh.write('\nImporting dataset into current history.\n')
c80fae8c94c1 Uploaded greg parents: diff changeset	35 new_hda_dict = gi.histories.upload_dataset_from_library(history_id, dataset_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	36 new_hda_name = new_hda_dict['name']
c80fae8c94c1 Uploaded greg parents: diff changeset	37 history_datasets[new_hda_name] = new_hda_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	38 return history_datasets
c80fae8c94c1 Uploaded greg parents: diff changeset	39
c80fae8c94c1 Uploaded greg parents: diff changeset	40
c80fae8c94c1 Uploaded greg parents: diff changeset	41 def copy_history_dataset_to_library(gi, library_id, dataset_id, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	42 # Copy a history dataset to a data library.
c80fae8c94c1 Uploaded greg parents: diff changeset	43 outputfh.write('\nCopying history dataset with id %s to data library with id %s.\n' % (str(dataset_id), str(library_id)))
c80fae8c94c1 Uploaded greg parents: diff changeset	44 new_library_dataset_dict = gi.libraries.copy_from_dataset(library_id, dataset_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	45 return new_library_dataset_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	46
c80fae8c94c1 Uploaded greg parents: diff changeset	47
c80fae8c94c1 Uploaded greg parents: diff changeset	48 def copy_dataset_to_storage(src_path, dst_base_path, dataset_name, output_fh):
1 d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	49 # Copy a dataset to a storage directory on disk. Use the date
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	50 # to name the storage directory to enable storing a file per day
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	51 # (multiple runs per day will overwrite the existing file).
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	52 date_str = datetime.now().strftime("%Y_%m_%d")
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	53 dst_dir = os.path.join(dst_base_path, date_str)
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	54 if not os.path.isdir(dst_dir):
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	55 os.makedirs(dst_dir)
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	56 dst_path = os.path.join(dst_dir, dataset_name)
0 c80fae8c94c1 Uploaded greg parents: diff changeset	57 shutil.copyfile(src_path, dst_path)
c80fae8c94c1 Uploaded greg parents: diff changeset	58 outputfh.write("Copied %s to storage.\n" % dataset_name)
c80fae8c94c1 Uploaded greg parents: diff changeset	59
c80fae8c94c1 Uploaded greg parents: diff changeset	60
c80fae8c94c1 Uploaded greg parents: diff changeset	61 def delete_history_dataset(gi, history_id, dataset_id, outputfh, purge=False):
c80fae8c94c1 Uploaded greg parents: diff changeset	62 # Delete a history dataset.
c80fae8c94c1 Uploaded greg parents: diff changeset	63 outputfh.write("\nDeleting history dataset with id %s.\n" % dataset_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	64 gi.histories.delete_dataset(history_id, dataset_id, purge=purge)
c80fae8c94c1 Uploaded greg parents: diff changeset	65
c80fae8c94c1 Uploaded greg parents: diff changeset	66
c80fae8c94c1 Uploaded greg parents: diff changeset	67 def delete_library_dataset(gi, library_id, dataset_id, outputfh, purged=False):
c80fae8c94c1 Uploaded greg parents: diff changeset	68 # Delete a library dataset.
c80fae8c94c1 Uploaded greg parents: diff changeset	69 outputfh.write("\nDeleting library dataset with id %s.\n" % dataset_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	70 deleted_dataset_dict = gi.libraries.delete_library_dataset(library_id, dataset_id, purged=purged)
c80fae8c94c1 Uploaded greg parents: diff changeset	71 return deleted_dataset_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	72
c80fae8c94c1 Uploaded greg parents: diff changeset	73
c80fae8c94c1 Uploaded greg parents: diff changeset	74 def get_config_settings(config_file, section='defaults'):
c80fae8c94c1 Uploaded greg parents: diff changeset	75 # Return a dictionary consisting of the key / value pairs
c80fae8c94c1 Uploaded greg parents: diff changeset	76 # of the defaults section of config_file.
c80fae8c94c1 Uploaded greg parents: diff changeset	77 d = {}
c80fae8c94c1 Uploaded greg parents: diff changeset	78 config_parser = configparser.ConfigParser()
c80fae8c94c1 Uploaded greg parents: diff changeset	79 config_parser.read(config_file)
c80fae8c94c1 Uploaded greg parents: diff changeset	80 for key, value in config_parser.items(section):
c80fae8c94c1 Uploaded greg parents: diff changeset	81 if section == 'defaults':
c80fae8c94c1 Uploaded greg parents: diff changeset	82 d[string.upper(key)] = value
c80fae8c94c1 Uploaded greg parents: diff changeset	83 else:
c80fae8c94c1 Uploaded greg parents: diff changeset	84 d[key] = value
c80fae8c94c1 Uploaded greg parents: diff changeset	85 return d
c80fae8c94c1 Uploaded greg parents: diff changeset	86
c80fae8c94c1 Uploaded greg parents: diff changeset	87
c80fae8c94c1 Uploaded greg parents: diff changeset	88 def get_data_library_dict(gi, name, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	89 # Use the Galaxy API to get the data library named name.
c80fae8c94c1 Uploaded greg parents: diff changeset	90 outputfh.write("\nSearching for data library named %s.\n" % name)
c80fae8c94c1 Uploaded greg parents: diff changeset	91 # The following is not correctly filtering out deleted libraries.
c80fae8c94c1 Uploaded greg parents: diff changeset	92 data_lib_dicts = gi.libraries.get_libraries(library_id=None, name=name, deleted=False)
c80fae8c94c1 Uploaded greg parents: diff changeset	93 for data_lib_dict in data_lib_dicts:
c80fae8c94c1 Uploaded greg parents: diff changeset	94 if data_lib_dict['name'] == name and data_lib_dict['deleted'] not in [True, 'true', 'True']:
c80fae8c94c1 Uploaded greg parents: diff changeset	95 outputfh.write("Found data library named %s.\n" % name)
c80fae8c94c1 Uploaded greg parents: diff changeset	96 outputfh.write("%s\n" % str(data_lib_dict))
c80fae8c94c1 Uploaded greg parents: diff changeset	97 return data_lib_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	98 return None
c80fae8c94c1 Uploaded greg parents: diff changeset	99
c80fae8c94c1 Uploaded greg parents: diff changeset	100
c80fae8c94c1 Uploaded greg parents: diff changeset	101 def get_history_status(gi, history_id):
c80fae8c94c1 Uploaded greg parents: diff changeset	102 return gi.histories.get_status(history_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	103
c80fae8c94c1 Uploaded greg parents: diff changeset	104
c80fae8c94c1 Uploaded greg parents: diff changeset	105 def get_history_dataset_id_by_name(gi, history_id, dataset_name, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	106 # Use the Galaxy API to get the bcftools merge dataset id
c80fae8c94c1 Uploaded greg parents: diff changeset	107 # from the current history.
c80fae8c94c1 Uploaded greg parents: diff changeset	108 outputfh.write("\nSearching for history dataset named %s.\n" % str(dataset_name))
c80fae8c94c1 Uploaded greg parents: diff changeset	109 history_dataset_dicts = get_history_datasets(gi, history_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	110 for name, hd_dict in history_dataset_dicts.items():
c80fae8c94c1 Uploaded greg parents: diff changeset	111 name = name.lower()
c80fae8c94c1 Uploaded greg parents: diff changeset	112 if name.startswith(dataset_name.lower()):
c80fae8c94c1 Uploaded greg parents: diff changeset	113 outputfh.write("Found dataset named %s.\n" % str(dataset_name))
c80fae8c94c1 Uploaded greg parents: diff changeset	114 return hd_dict['id']
c80fae8c94c1 Uploaded greg parents: diff changeset	115 return None
c80fae8c94c1 Uploaded greg parents: diff changeset	116
c80fae8c94c1 Uploaded greg parents: diff changeset	117
c80fae8c94c1 Uploaded greg parents: diff changeset	118 def get_history_datasets(gi, history_id):
c80fae8c94c1 Uploaded greg parents: diff changeset	119 history_datasets = {}
c80fae8c94c1 Uploaded greg parents: diff changeset	120 history_dict = gi.histories.show_history(history_id, contents=True, deleted='false', details=None)
c80fae8c94c1 Uploaded greg parents: diff changeset	121 for contents_dict in history_dict:
c80fae8c94c1 Uploaded greg parents: diff changeset	122 if contents_dict['history_content_type'] == 'dataset':
c80fae8c94c1 Uploaded greg parents: diff changeset	123 dataset_name = contents_dict['name']
c80fae8c94c1 Uploaded greg parents: diff changeset	124 # Don't include the "Queue genotype workflow" dataset.
c80fae8c94c1 Uploaded greg parents: diff changeset	125 if dataset_name.startswith("Queue genotype workflow"):
c80fae8c94c1 Uploaded greg parents: diff changeset	126 continue
c80fae8c94c1 Uploaded greg parents: diff changeset	127 history_datasets[dataset_name] = contents_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	128 return history_datasets
c80fae8c94c1 Uploaded greg parents: diff changeset	129
c80fae8c94c1 Uploaded greg parents: diff changeset	130
c80fae8c94c1 Uploaded greg parents: diff changeset	131 def get_library_dataset_file_path(gi, library_id, dataset_id, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	132 dataset_dict = gi.libraries.show_dataset(library_id, dataset_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	133 outputfh.write("\nReturning file path of library dataset.\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	134 return dataset_dict.get('file_name', None)
c80fae8c94c1 Uploaded greg parents: diff changeset	135
c80fae8c94c1 Uploaded greg parents: diff changeset	136
c80fae8c94c1 Uploaded greg parents: diff changeset	137 def get_library_dataset_id_by_name(gi, data_lib_id, dataset_name, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	138 # Use the Galaxy API to get the all_genotyped_samples.vcf dataset id.
c80fae8c94c1 Uploaded greg parents: diff changeset	139 # We're assuming it is in the root folder.
c80fae8c94c1 Uploaded greg parents: diff changeset	140 outputfh.write("\nSearching for library dataset named %s.\n" % str(dataset_name))
c80fae8c94c1 Uploaded greg parents: diff changeset	141 lib_item_dicts = gi.libraries.show_library(data_lib_id, contents=True)
c80fae8c94c1 Uploaded greg parents: diff changeset	142 for lib_item_dict in lib_item_dicts:
c80fae8c94c1 Uploaded greg parents: diff changeset	143 if lib_item_dict['type'] == 'file':
c80fae8c94c1 Uploaded greg parents: diff changeset	144 dataset_name = lib_item_dict['name'].lstrip('/').lower()
c80fae8c94c1 Uploaded greg parents: diff changeset	145 if dataset_name.startswith(dataset_name):
c80fae8c94c1 Uploaded greg parents: diff changeset	146 outputfh.write("Found dataset named %s.\n" % str(dataset_name))
c80fae8c94c1 Uploaded greg parents: diff changeset	147 return lib_item_dict['id']
c80fae8c94c1 Uploaded greg parents: diff changeset	148 return None
c80fae8c94c1 Uploaded greg parents: diff changeset	149
c80fae8c94c1 Uploaded greg parents: diff changeset	150
c80fae8c94c1 Uploaded greg parents: diff changeset	151 def get_value_from_config(config_defaults, value):
c80fae8c94c1 Uploaded greg parents: diff changeset	152 return config_defaults.get(value, None)
c80fae8c94c1 Uploaded greg parents: diff changeset	153
c80fae8c94c1 Uploaded greg parents: diff changeset	154
c80fae8c94c1 Uploaded greg parents: diff changeset	155 def get_workflow(gi, name, outputfh, galaxy_base_url=None, api_key=None):
c80fae8c94c1 Uploaded greg parents: diff changeset	156 outputfh.write("\nSearching for workflow named %s\n" % name)
c80fae8c94c1 Uploaded greg parents: diff changeset	157 workflow_info_dicts = gi.workflows.get_workflows(name=name, published=True)
c80fae8c94c1 Uploaded greg parents: diff changeset	158 if len(workflow_info_dicts) == 0:
c80fae8c94c1 Uploaded greg parents: diff changeset	159 return None, None
c80fae8c94c1 Uploaded greg parents: diff changeset	160 wf_info_dict = workflow_info_dicts[0]
c80fae8c94c1 Uploaded greg parents: diff changeset	161 workflow_id = wf_info_dict['id']
c80fae8c94c1 Uploaded greg parents: diff changeset	162 # Get the complete workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	163 workflow_dict = gi.workflows.show_workflow(workflow_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	164 outputfh.write("Found workflow named %s.\n" % name)
c80fae8c94c1 Uploaded greg parents: diff changeset	165 return workflow_id, workflow_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	166
c80fae8c94c1 Uploaded greg parents: diff changeset	167
c80fae8c94c1 Uploaded greg parents: diff changeset	168 def get_workflow_input_datasets(gi, history_datasets, workflow_name, workflow_dict, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	169 # Map the history datasets to the input datasets for the workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	170 workflow_inputs = {}
c80fae8c94c1 Uploaded greg parents: diff changeset	171 outputfh.write("\nMapping datasets from history to workflow %s.\n" % workflow_name)
c80fae8c94c1 Uploaded greg parents: diff changeset	172 steps_dict = workflow_dict.get('steps', None)
c80fae8c94c1 Uploaded greg parents: diff changeset	173 if steps_dict is not None:
c80fae8c94c1 Uploaded greg parents: diff changeset	174 for step_index, step_dict in steps_dict.items():
c80fae8c94c1 Uploaded greg parents: diff changeset	175 # Dicts that define dataset inputs for a workflow
c80fae8c94c1 Uploaded greg parents: diff changeset	176 # look like this.
c80fae8c94c1 Uploaded greg parents: diff changeset	177 # "0": {
c80fae8c94c1 Uploaded greg parents: diff changeset	178 # "tool_id": null,
c80fae8c94c1 Uploaded greg parents: diff changeset	179 # "tool_version": null,
c80fae8c94c1 Uploaded greg parents: diff changeset	180 # "id": 0,
c80fae8c94c1 Uploaded greg parents: diff changeset	181 # "input_steps": {},
c80fae8c94c1 Uploaded greg parents: diff changeset	182 # "tool_inputs": {},
c80fae8c94c1 Uploaded greg parents: diff changeset	183 # "type": "data_input",
c80fae8c94c1 Uploaded greg parents: diff changeset	184 # "annotation": null
c80fae8c94c1 Uploaded greg parents: diff changeset	185 # },
c80fae8c94c1 Uploaded greg parents: diff changeset	186 tool_id = step_dict.get('tool_id', None)
c80fae8c94c1 Uploaded greg parents: diff changeset	187 tool_type = step_dict.get('type', None)
c80fae8c94c1 Uploaded greg parents: diff changeset	188 # This requires the workflow input dataset annotation to be a
c80fae8c94c1 Uploaded greg parents: diff changeset	189 # string # (e.g., report) that enables it to be appropriatey
c80fae8c94c1 Uploaded greg parents: diff changeset	190 # matched to a dataset (e.g., axiongt1_report.txt).
c80fae8c94c1 Uploaded greg parents: diff changeset	191 # 1. affy_metadata.tabular - must have the word "metadata" in
c80fae8c94c1 Uploaded greg parents: diff changeset	192 # the file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	193 # 2. sample_attributes.tabular - must have the word "attributes"
c80fae8c94c1 Uploaded greg parents: diff changeset	194 # in the file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	195 # 3. probeset_annotation.csv - must have the word "annotation" in
c80fae8c94c1 Uploaded greg parents: diff changeset	196 # the file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	197 # 4. <summary file>.txt - must have the the word "summary" in the
c80fae8c94c1 Uploaded greg parents: diff changeset	198 # file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	199 # 5. <snp-posteriors file>.txt - must have the the word
c80fae8c94c1 Uploaded greg parents: diff changeset	200 # "snp-posteriors" in the file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	201 # 6. <report file>.txt - must have the the word "report" in the
c80fae8c94c1 Uploaded greg parents: diff changeset	202 # file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	203 # 7. <confidences file>.txt - must have the the word "confidences"
c80fae8c94c1 Uploaded greg parents: diff changeset	204 # in the file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	205 # 8. <calls file>.txt - must have the the word "calls" in the
c80fae8c94c1 Uploaded greg parents: diff changeset	206 # file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	207 # 9. all_genotyped_samples.vcf - must have "all_genotyped_samples"
c80fae8c94c1 Uploaded greg parents: diff changeset	208 # in the file name.
c80fae8c94c1 Uploaded greg parents: diff changeset	209 annotation = step_dict.get('annotation', None)
c80fae8c94c1 Uploaded greg parents: diff changeset	210 if tool_id is None and tool_type == 'data_input' and annotation is not None:
c80fae8c94c1 Uploaded greg parents: diff changeset	211 annotation_check = annotation.lower()
c80fae8c94c1 Uploaded greg parents: diff changeset	212 # inputs is a list and workflow input datasets
c80fae8c94c1 Uploaded greg parents: diff changeset	213 # have no inputs.
c80fae8c94c1 Uploaded greg parents: diff changeset	214 for input_hda_name, input_hda_dict in history_datasets.items():
c80fae8c94c1 Uploaded greg parents: diff changeset	215 input_hda_name_check = input_hda_name.lower()
c80fae8c94c1 Uploaded greg parents: diff changeset	216 if input_hda_name_check.find(annotation_check) >= 0:
c80fae8c94c1 Uploaded greg parents: diff changeset	217 workflow_inputs[step_index] = {'src': 'hda', 'id': input_hda_dict['id']}
c80fae8c94c1 Uploaded greg parents: diff changeset	218 outputfh.write(" - Mapped dataset %s from history to workflow input dataset with annotation %s.\n" % (input_hda_name, annotation))
c80fae8c94c1 Uploaded greg parents: diff changeset	219 break
c80fae8c94c1 Uploaded greg parents: diff changeset	220 return workflow_inputs
c80fae8c94c1 Uploaded greg parents: diff changeset	221
c80fae8c94c1 Uploaded greg parents: diff changeset	222
c80fae8c94c1 Uploaded greg parents: diff changeset	223 def start_workflow(gi, workflow_id, workflow_name, inputs, params, history_id, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	224 outputfh.write("\nExecuting workflow %s.\n" % workflow_name)
c80fae8c94c1 Uploaded greg parents: diff changeset	225 workflow_invocation_dict = gi.workflows.invoke_workflow(workflow_id, inputs=inputs, params=params, history_id=history_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	226 outputfh.write("Response from executing workflow %s:\n" % workflow_name)
c80fae8c94c1 Uploaded greg parents: diff changeset	227 outputfh.write("%s\n" % str(workflow_invocation_dict))
c80fae8c94c1 Uploaded greg parents: diff changeset	228
c80fae8c94c1 Uploaded greg parents: diff changeset	229
c80fae8c94c1 Uploaded greg parents: diff changeset	230 def rename_library_dataset(gi, dataset_id, name, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	231 outputfh.write("\nRenaming library dataset with id %s to be named %s.\n" % (str(dataset_id), str(name)))
c80fae8c94c1 Uploaded greg parents: diff changeset	232 library_dataset_dict = gi.libraries.update_library_dataset(dataset_id, name=name)
c80fae8c94c1 Uploaded greg parents: diff changeset	233 return library_dataset_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	234
c80fae8c94c1 Uploaded greg parents: diff changeset	235
c80fae8c94c1 Uploaded greg parents: diff changeset	236 def update_workflow_params(workflow_dict, dbkey, outputfh):
c80fae8c94c1 Uploaded greg parents: diff changeset	237 parameter_updates = None
c80fae8c94c1 Uploaded greg parents: diff changeset	238 name = workflow_dict['name']
c80fae8c94c1 Uploaded greg parents: diff changeset	239 outputfh.write("\nChecking for tool parameter updates for workflow %s using dbkey %s.\n" % (name, dbkey))
c80fae8c94c1 Uploaded greg parents: diff changeset	240 step_dicts = workflow_dict.get('steps', None)
c80fae8c94c1 Uploaded greg parents: diff changeset	241 for step_id, step_dict in step_dicts.items():
c80fae8c94c1 Uploaded greg parents: diff changeset	242 tool_id = step_dict['tool_id']
c80fae8c94c1 Uploaded greg parents: diff changeset	243 if tool_id is None:
c80fae8c94c1 Uploaded greg parents: diff changeset	244 continue
c80fae8c94c1 Uploaded greg parents: diff changeset	245 # Handle reference_source entries
c80fae8c94c1 Uploaded greg parents: diff changeset	246 if tool_id.find('affy2vcf') > 0:
c80fae8c94c1 Uploaded greg parents: diff changeset	247 tool_inputs_dict = step_dict['tool_inputs']
c80fae8c94c1 Uploaded greg parents: diff changeset	248 # The queue_genotype_workflow tool provides a selection of only
c80fae8c94c1 Uploaded greg parents: diff changeset	249 # a locally cached reference genome (not a history item), so dbkey
c80fae8c94c1 Uploaded greg parents: diff changeset	250 # will always refer to a locally cached genome.
c80fae8c94c1 Uploaded greg parents: diff changeset	251 # The affy2vcf tool allows the user to select either a locally
c80fae8c94c1 Uploaded greg parents: diff changeset	252 # cached reference genome or a history item, but the workflow is
c80fae8c94c1 Uploaded greg parents: diff changeset	253 # defined to use a locally cached reference genome by default.
c80fae8c94c1 Uploaded greg parents: diff changeset	254 reference_genome_source_cond_dict = tool_inputs_dict['reference_genome_source_cond']
c80fae8c94c1 Uploaded greg parents: diff changeset	255 # The value of reference_genome_source_cond_dict['reference_genome_source']
c80fae8c94c1 Uploaded greg parents: diff changeset	256 # will always be 'cached'.
c80fae8c94c1 Uploaded greg parents: diff changeset	257 workflow_db_key = reference_genome_source_cond_dict['locally_cached_item']
c80fae8c94c1 Uploaded greg parents: diff changeset	258 if dbkey != workflow_db_key:
c80fae8c94c1 Uploaded greg parents: diff changeset	259 reference_genome_source_cond_dict['locally_cached_item'] = dbkey
c80fae8c94c1 Uploaded greg parents: diff changeset	260 parameter_updates = {}
c80fae8c94c1 Uploaded greg parents: diff changeset	261 parameter_updates[step_id] = reference_genome_source_cond_dict
c80fae8c94c1 Uploaded greg parents: diff changeset	262 outputfh.write("Updated step id %s with the following entry:\n%s\n" % (step_id, str(reference_genome_source_cond_dict)))
c80fae8c94c1 Uploaded greg parents: diff changeset	263 return parameter_updates
c80fae8c94c1 Uploaded greg parents: diff changeset	264
c80fae8c94c1 Uploaded greg parents: diff changeset	265
c80fae8c94c1 Uploaded greg parents: diff changeset	266 outputfh = open(args.output, "w")
c80fae8c94c1 Uploaded greg parents: diff changeset	267 config_defaults = get_config_settings(args.config_file)
c80fae8c94c1 Uploaded greg parents: diff changeset	268 user_api_key = open(args.api_key, 'r').read()
c80fae8c94c1 Uploaded greg parents: diff changeset	269 admin_api_key = get_value_from_config(config_defaults, 'ADMIN_API_KEY')
c80fae8c94c1 Uploaded greg parents: diff changeset	270 galaxy_base_url = get_value_from_config(config_defaults, 'GALAXY_BASE_URL')
c80fae8c94c1 Uploaded greg parents: diff changeset	271 gi = galaxy.GalaxyInstance(url=galaxy_base_url, key=user_api_key)
c80fae8c94c1 Uploaded greg parents: diff changeset	272 ags_dataset_name = get_value_from_config(config_defaults, 'ALL_GENOTYPED_SAMPLES_DATASET_NAME')
c80fae8c94c1 Uploaded greg parents: diff changeset	273 ags_library_name = get_value_from_config(config_defaults, 'ALL_GENOTYPED_SAMPLES_LIBRARY_NAME')
c80fae8c94c1 Uploaded greg parents: diff changeset	274 ags_storage_dir = get_value_from_config(config_defaults, 'ALL_GENOTYPED_SAMPLES_STORAGE_DIR')
c80fae8c94c1 Uploaded greg parents: diff changeset	275 coralsnp_workflow_name = get_value_from_config(config_defaults, 'CORALSNP_WORKFLOW_NAME')
c80fae8c94c1 Uploaded greg parents: diff changeset	276 es_workflow_name = get_value_from_config(config_defaults, 'ENSURE_SYNCED_WORKFLOW_NAME')
c80fae8c94c1 Uploaded greg parents: diff changeset	277 vam_workflow_name = get_value_from_config(config_defaults, 'VALIDATE_AFFY_METADATA_WORKFLOW_NAME')
c80fae8c94c1 Uploaded greg parents: diff changeset	278
c80fae8c94c1 Uploaded greg parents: diff changeset	279 affy_metadata_is_valid = False
c80fae8c94c1 Uploaded greg parents: diff changeset	280 datasets_have_queued = False
c80fae8c94c1 Uploaded greg parents: diff changeset	281 stag_database_updated = False
c80fae8c94c1 Uploaded greg parents: diff changeset	282 synced = False
c80fae8c94c1 Uploaded greg parents: diff changeset	283 lock = threading.Lock()
c80fae8c94c1 Uploaded greg parents: diff changeset	284 lock.acquire(True)
c80fae8c94c1 Uploaded greg parents: diff changeset	285 try:
c80fae8c94c1 Uploaded greg parents: diff changeset	286 # Get the current history datasets. At this point, the
c80fae8c94c1 Uploaded greg parents: diff changeset	287 # history will ideally contain only the datasets to be
c80fae8c94c1 Uploaded greg parents: diff changeset	288 # used as inputs to the 3 workflows, EnsureSynced,
c80fae8c94c1 Uploaded greg parents: diff changeset	289 # ValidateAffyMetadata and CoralSNP.
c80fae8c94c1 Uploaded greg parents: diff changeset	290 history_datasets = get_history_datasets(gi, args.history_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	291
c80fae8c94c1 Uploaded greg parents: diff changeset	292 # Get the All Genotyped Samples data library.
c80fae8c94c1 Uploaded greg parents: diff changeset	293 ags_data_library_dict = get_data_library_dict(gi, ags_library_name, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	294 ags_library_id = ags_data_library_dict['id']
c80fae8c94c1 Uploaded greg parents: diff changeset	295 # Get the public all_genotyped_samples.vcf library dataset id.
c80fae8c94c1 Uploaded greg parents: diff changeset	296 ags_ldda_id = get_library_dataset_id_by_name(gi, ags_library_id, ags_dataset_name, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	297
c80fae8c94c1 Uploaded greg parents: diff changeset	298 # Import the public all_genotyped_samples dataset from
c80fae8c94c1 Uploaded greg parents: diff changeset	299 # the data library to the current history.
c80fae8c94c1 Uploaded greg parents: diff changeset	300 history_datasets = add_library_dataset_to_history(gi, args.history_id, ags_ldda_id, history_datasets, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	301 outputfh.write("\nSleeping for 5 seconds...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	302 time.sleep(5)
c80fae8c94c1 Uploaded greg parents: diff changeset	303
c80fae8c94c1 Uploaded greg parents: diff changeset	304 # Get the EnsureSynced workflow
c80fae8c94c1 Uploaded greg parents: diff changeset	305 es_workflow_id, es_workflow_dict = get_workflow(gi, es_workflow_name, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	306 outputfh.write("\nEnsureSynced workflow id: %s\n" % str(es_workflow_id))
c80fae8c94c1 Uploaded greg parents: diff changeset	307 # Map the history datasets to the input datasets for
c80fae8c94c1 Uploaded greg parents: diff changeset	308 # the EnsureSynced workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	309 es_workflow_input_datasets = get_workflow_input_datasets(gi, history_datasets, es_workflow_name, es_workflow_dict, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	310 # Start the EnsureSynced workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	311 start_workflow(gi, es_workflow_id, es_workflow_name, es_workflow_input_datasets, None, args.history_id, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	312 outputfh.write("\nSleeping for 15 seconds...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	313 time.sleep(15)
c80fae8c94c1 Uploaded greg parents: diff changeset	314 # Poll the history datasets, checking the statuses, and wait until
c80fae8c94c1 Uploaded greg parents: diff changeset	315 # the workflow is finished. The workflow itself simply schedules
c80fae8c94c1 Uploaded greg parents: diff changeset	316 # all of the jobs, so it cannot be checked for a state.
c80fae8c94c1 Uploaded greg parents: diff changeset	317 while True:
c80fae8c94c1 Uploaded greg parents: diff changeset	318 history_status_dict = get_history_status(gi, args.history_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	319 sd_dict = history_status_dict['state_details']
c80fae8c94c1 Uploaded greg parents: diff changeset	320 outputfh.write("\nsd_dict: %s\n" % str(sd_dict))
c80fae8c94c1 Uploaded greg parents: diff changeset	321 # The queue_genotype_workflow tool will continue to be in a
c80fae8c94c1 Uploaded greg parents: diff changeset	322 # "running" state while inside this for loop, so we know that
c80fae8c94c1 Uploaded greg parents: diff changeset	323 # the workflow has completed if only 1 dataset has this state.
c80fae8c94c1 Uploaded greg parents: diff changeset	324 if sd_dict['running'] <= 1:
c80fae8c94c1 Uploaded greg parents: diff changeset	325 if sd_dict['error'] == 0:
c80fae8c94c1 Uploaded greg parents: diff changeset	326 # The all_genotyped_samples.vcf file is
c80fae8c94c1 Uploaded greg parents: diff changeset	327 # in sync with the stag database.
c80fae8c94c1 Uploaded greg parents: diff changeset	328 synced = True
c80fae8c94c1 Uploaded greg parents: diff changeset	329 break
c80fae8c94c1 Uploaded greg parents: diff changeset	330 outputfh.write("\nSleeping for 5 seconds...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	331 time.sleep(5)
c80fae8c94c1 Uploaded greg parents: diff changeset	332
c80fae8c94c1 Uploaded greg parents: diff changeset	333 if synced:
c80fae8c94c1 Uploaded greg parents: diff changeset	334 # Get the ValidateAffyMetadata workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	335 vam_workflow_id, vam_workflow_dict = get_workflow(gi, vam_workflow_name, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	336 outputfh.write("\nValidateAffyMetadata workflow id: %s\n" % str(vam_workflow_id))
c80fae8c94c1 Uploaded greg parents: diff changeset	337 # Map the history datasets to the input datasets for
c80fae8c94c1 Uploaded greg parents: diff changeset	338 # the ValidateAffyMetadata workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	339 vam_workflow_input_datasets = get_workflow_input_datasets(gi, history_datasets, vam_workflow_name, vam_workflow_dict, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	340 # Start the ValidateAffyMetadata workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	341 start_workflow(gi, vam_workflow_id, vam_workflow_name, vam_workflow_input_datasets, None, args.history_id, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	342 outputfh.write("\nSleeping for 15 seconds...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	343 time.sleep(15)
c80fae8c94c1 Uploaded greg parents: diff changeset	344 # Poll the history datasets, checking the statuses, and wait until
c80fae8c94c1 Uploaded greg parents: diff changeset	345 # the workflow is finished.
c80fae8c94c1 Uploaded greg parents: diff changeset	346 while True:
c80fae8c94c1 Uploaded greg parents: diff changeset	347 history_status_dict = get_history_status(gi, args.history_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	348 sd_dict = history_status_dict['state_details']
c80fae8c94c1 Uploaded greg parents: diff changeset	349 outputfh.write("\nsd_dict: %s\n" % str(sd_dict))
c80fae8c94c1 Uploaded greg parents: diff changeset	350 # The queue_genotype_workflow tool will continue to be in a
c80fae8c94c1 Uploaded greg parents: diff changeset	351 # "running" state while inside this for loop, so we know that
c80fae8c94c1 Uploaded greg parents: diff changeset	352 # the workflow has completed if only 1 dataset has this state.
c80fae8c94c1 Uploaded greg parents: diff changeset	353 if sd_dict['running'] <= 1:
c80fae8c94c1 Uploaded greg parents: diff changeset	354 if sd_dict['error'] == 0:
c80fae8c94c1 Uploaded greg parents: diff changeset	355 # The metadata is valid.
c80fae8c94c1 Uploaded greg parents: diff changeset	356 affy_metadata_is_valid = True
c80fae8c94c1 Uploaded greg parents: diff changeset	357 break
c80fae8c94c1 Uploaded greg parents: diff changeset	358 outputfh.write("\nSleeping for 5 seconds...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	359 time.sleep(5)
c80fae8c94c1 Uploaded greg parents: diff changeset	360 else:
c80fae8c94c1 Uploaded greg parents: diff changeset	361 outputfh.write("\nProcessing ended in error...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	362 outputfh.close()
c80fae8c94c1 Uploaded greg parents: diff changeset	363 lock.release()
c80fae8c94c1 Uploaded greg parents: diff changeset	364 sys.exit(1)
c80fae8c94c1 Uploaded greg parents: diff changeset	365
c80fae8c94c1 Uploaded greg parents: diff changeset	366 if affy_metadata_is_valid:
c80fae8c94c1 Uploaded greg parents: diff changeset	367 # Get the CoralSNP workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	368 coralsnp_workflow_id, coralsnp_workflow_dict = get_workflow(gi, coralsnp_workflow_name, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	369 outputfh.write("\nCoralSNP workflow id: %s\n" % str(coralsnp_workflow_id))
c80fae8c94c1 Uploaded greg parents: diff changeset	370 # Map the history datasets to the input datasets for
c80fae8c94c1 Uploaded greg parents: diff changeset	371 # the CoralSNP workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	372 coralsnp_workflow_input_datasets = get_workflow_input_datasets(gi, history_datasets, coralsnp_workflow_name, coralsnp_workflow_dict, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	373 outputfh.write("\nCoralSNP workflow input datasets: %s\n" % str(coralsnp_workflow_input_datasets))
c80fae8c94c1 Uploaded greg parents: diff changeset	374 # Get the CoralSNP workflow params that could be updated.
c80fae8c94c1 Uploaded greg parents: diff changeset	375 coralsnp_params = update_workflow_params(coralsnp_workflow_dict, args.dbkey, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	376 outputfh.write("\nCoralSNP params: %s\n" % str(coralsnp_params))
c80fae8c94c1 Uploaded greg parents: diff changeset	377 # Start the CoralSNP workflow.
c80fae8c94c1 Uploaded greg parents: diff changeset	378 start_workflow(gi, coralsnp_workflow_id, coralsnp_workflow_name, coralsnp_workflow_input_datasets, coralsnp_params, args.history_id, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	379 outputfh.write("\nSleeping for 15 seconds...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	380 time.sleep(15)
c80fae8c94c1 Uploaded greg parents: diff changeset	381 # Poll the history datasets, checking the statuses, and wait until
c80fae8c94c1 Uploaded greg parents: diff changeset	382 # the workflow is finished. The workflow itself simply schedules
c80fae8c94c1 Uploaded greg parents: diff changeset	383 # all of the jobs, so it cannot be checked for a state.
c80fae8c94c1 Uploaded greg parents: diff changeset	384 while True:
c80fae8c94c1 Uploaded greg parents: diff changeset	385 history_status_dict = get_history_status(gi, args.history_id)
c80fae8c94c1 Uploaded greg parents: diff changeset	386 sd_dict = history_status_dict['state_details']
c80fae8c94c1 Uploaded greg parents: diff changeset	387 outputfh.write("\nsd_dict: %s\n" % str(sd_dict))
c80fae8c94c1 Uploaded greg parents: diff changeset	388 # The queue_genotype_workflow tool will continue to be in a
c80fae8c94c1 Uploaded greg parents: diff changeset	389 # "running" state while inside this for loop, so we know that
c80fae8c94c1 Uploaded greg parents: diff changeset	390 # the workflow has completed if no datasets are in the "new" or
c80fae8c94c1 Uploaded greg parents: diff changeset	391 # "queued" state and there is only 1 dataset in the "running"
c80fae8c94c1 Uploaded greg parents: diff changeset	392 # state. We cannot filter on datasets in the "paused" state
c80fae8c94c1 Uploaded greg parents: diff changeset	393 # because any datasets downstream from one in an "error" state
c80fae8c94c1 Uploaded greg parents: diff changeset	394 # will automatically be given a "paused" state. Of course, we'll
c80fae8c94c1 Uploaded greg parents: diff changeset	395 # always break if any datasets are in the "error" state. At
c80fae8c94c1 Uploaded greg parents: diff changeset	396 # least one dataset must have reached the "queued" state before
c80fae8c94c1 Uploaded greg parents: diff changeset	397 # the workflow is complete.
c80fae8c94c1 Uploaded greg parents: diff changeset	398 if not datasets_have_queued:
c80fae8c94c1 Uploaded greg parents: diff changeset	399 if sd_dict['queued'] > 0:
c80fae8c94c1 Uploaded greg parents: diff changeset	400 datasets_have_queued = True
c80fae8c94c1 Uploaded greg parents: diff changeset	401 if sd_dict['error'] != 0:
c80fae8c94c1 Uploaded greg parents: diff changeset	402 break
c80fae8c94c1 Uploaded greg parents: diff changeset	403 if datasets_have_queued and sd_dict['queued'] == 0 and sd_dict['new'] == 0 and sd_dict['running'] <= 1:
c80fae8c94c1 Uploaded greg parents: diff changeset	404 # The stag database has been updated.
c80fae8c94c1 Uploaded greg parents: diff changeset	405 stag_database_updated = True
c80fae8c94c1 Uploaded greg parents: diff changeset	406 break
c80fae8c94c1 Uploaded greg parents: diff changeset	407 outputfh.write("\nSleeping for 5 seconds...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	408 time.sleep(5)
c80fae8c94c1 Uploaded greg parents: diff changeset	409 if stag_database_updated:
c80fae8c94c1 Uploaded greg parents: diff changeset	410 # Get the id of the "bcftools merge" dataset in the current history.
c80fae8c94c1 Uploaded greg parents: diff changeset	411 bcftools_merge_dataset_id = get_history_dataset_id_by_name(gi, args.history_id, "bcftools merge", outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	412 # Create a new dataset in the All Genotyped Samples data library by
c80fae8c94c1 Uploaded greg parents: diff changeset	413 # importing the "bcftools merge" dataset from the current history.
c80fae8c94c1 Uploaded greg parents: diff changeset	414 # We'll do this as the coraldmin user.
c80fae8c94c1 Uploaded greg parents: diff changeset	415 admin_gi = galaxy.GalaxyInstance(url=galaxy_base_url, key=admin_api_key)
c80fae8c94c1 Uploaded greg parents: diff changeset	416 new_ags_dataset_dict = copy_history_dataset_to_library(admin_gi, ags_library_id, bcftools_merge_dataset_id, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	417 # Rename the ldda to be all_genotyped_samples.vcf.
c80fae8c94c1 Uploaded greg parents: diff changeset	418 new_ags_ldda_id = new_ags_dataset_dict['id']
c80fae8c94c1 Uploaded greg parents: diff changeset	419 renamed_ags_dataset_dict = rename_library_dataset(admin_gi, new_ags_ldda_id, ags_dataset_name, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	420 # Get the full path of the all_genotyped_samples.vcf library dataset.
c80fae8c94c1 Uploaded greg parents: diff changeset	421 ags_ldda_file_path = get_library_dataset_file_path(gi, ags_library_id, ags_ldda_id, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	422 # Copy the all_genotyped_samples.vcf dataset to storage. We
c80fae8c94c1 Uploaded greg parents: diff changeset	423 # will only keep a single copy of this file since this tool
c80fae8c94c1 Uploaded greg parents: diff changeset	424 # will end in an error before the CoralSNP workflow is started
c80fae8c94c1 Uploaded greg parents: diff changeset	425 # if the all_genotyped_samples.vcf file is not sync'd with the
c80fae8c94c1 Uploaded greg parents: diff changeset	426 # stag database.
c80fae8c94c1 Uploaded greg parents: diff changeset	427 copy_dataset_to_storage(ags_ldda_file_path, ags_storage_dir, ags_dataset_name, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	428 # Delete the original all_genotyped_samples library dataset.
c80fae8c94c1 Uploaded greg parents: diff changeset	429 deleted_dataset_dict = delete_library_dataset(admin_gi, ags_library_id, ags_ldda_id, outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	430 # To save disk space, delete the all_genotyped_samples hda
c80fae8c94c1 Uploaded greg parents: diff changeset	431 # in the current history to enable later purging by an admin.
c80fae8c94c1 Uploaded greg parents: diff changeset	432 ags_hda_id = get_history_dataset_id_by_name(gi, args.history_id, "all_genotyped_samples", outputfh)
c80fae8c94c1 Uploaded greg parents: diff changeset	433 delete_history_dataset(gi, args.history_id, ags_hda_id, outputfh)
1 d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	434 else:
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	435 outputfh.write("\nProcessing ended in error...\n")
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	436 outputfh.close()
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	437 lock.release()
d00c4cc7e8c2 Uploaded greg parents: 0 diff changeset	438 sys.exit(1)
0 c80fae8c94c1 Uploaded greg parents: diff changeset	439 else:
c80fae8c94c1 Uploaded greg parents: diff changeset	440 outputfh.write("\nProcessing ended in error...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	441 outputfh.close()
c80fae8c94c1 Uploaded greg parents: diff changeset	442 lock.release()
c80fae8c94c1 Uploaded greg parents: diff changeset	443 sys.exit(1)
c80fae8c94c1 Uploaded greg parents: diff changeset	444 except Exception as e:
c80fae8c94c1 Uploaded greg parents: diff changeset	445 outputfh.write("Exception preparing or executing either the ValidateAffyMetadata workflow or the CoralSNP workflow:\n%s\n" % str(e))
c80fae8c94c1 Uploaded greg parents: diff changeset	446 outputfh.write("\nProcessing ended in error...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	447 outputfh.close()
c80fae8c94c1 Uploaded greg parents: diff changeset	448 lock.release()
c80fae8c94c1 Uploaded greg parents: diff changeset	449 sys.exit(1)
c80fae8c94c1 Uploaded greg parents: diff changeset	450 finally:
c80fae8c94c1 Uploaded greg parents: diff changeset	451 lock.release()
c80fae8c94c1 Uploaded greg parents: diff changeset	452
c80fae8c94c1 Uploaded greg parents: diff changeset	453 outputfh.write("\nFinished processing...\n")
c80fae8c94c1 Uploaded greg parents: diff changeset	454 outputfh.close()

Mercurial > repos > greg > queue_genotype_workflow

annotate queue_genotype_workflow.py @ 1:d00c4cc7e8c2 draft