cobraxy: COBRAxy/src/marea.py annotate

annotate COBRAxy/src/marea.py @ 539:2fb97466e404 draft

Uploaded

author	francesco_lapi
date	Sat, 25 Oct 2025 14:55:13 +0000
parents
children	fcdbc81feb45

rev	line source
539 2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	2 MAREA: Enrichment and map styling for RAS/RPS data.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	3
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	4 This module compares groups of samples using RAS (Reaction Activity Scores) and/or
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	5 RPS (Reaction Propensity Scores), computes statistics (p-values, z-scores, fold change),
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	6 and applies visual styling to an SVG metabolic map (with optional PDF/PNG export).
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	7 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	8 from __future__ import division
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	9 import csv
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	10 from enum import Enum
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	11 import re
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	12 import sys
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	13 import numpy as np
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	14 import pandas as pd
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	15 import itertools as it
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	16 import scipy.stats as st
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	17 import lxml.etree as ET
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	18 import math
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	19 import utils.general_utils as utils
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	20 from PIL import Image
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	21 import os
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	22 import argparse
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	23 import pyvips
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	24 from typing import Tuple, Union, Optional, List, Dict
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	25 import copy
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	26
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	27 from pydeseq2.dds import DeseqDataSet
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	28 from pydeseq2.default_inference import DefaultInference
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	29 from pydeseq2.ds import DeseqStats
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	30
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	31 ERRORS = []
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	32 ########################## argparse ##########################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	33 ARGS :argparse.Namespace
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	34 def process_args(args:List[str] = None) -> argparse.Namespace:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	35 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	36 Parse command-line arguments exposed by the Galaxy frontend for this module.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	37
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	38 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	39 args: Optional list of arguments, defaults to sys.argv when None.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	40
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	41 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	42 Namespace: Parsed arguments.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	43 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	44 parser = argparse.ArgumentParser(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	45 usage = "%(prog)s [options]",
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	46 description = "process some value's genes to create a comparison's map.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	47
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	48 #General:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	49 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	50 '-td', '--tool_dir',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	51 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	52 required = True,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	53 help = 'your tool directory')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	54
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	55 parser.add_argument('-on', '--control', type = str)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	56 parser.add_argument('-ol', '--out_log', help = "Output log")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	57
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	58 #Computation details:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	59 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	60 '-co', '--comparison',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	61 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	62 default = 'manyvsmany',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	63 choices = ['manyvsmany', 'onevsrest', 'onevsmany'])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	64
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	65 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	66 '-te' ,'--test',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	67 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	68 default = 'ks',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	69 choices = ['ks', 'ttest_p', 'ttest_ind', 'wilcoxon', 'mw', 'DESeq'],
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	70 help = 'Statistical test to use (default: %(default)s)')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	71
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	72 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	73 '-pv' ,'--pValue',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	74 type = float,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	75 default = 0.1,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	76 help = 'P-Value threshold (default: %(default)s)')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	77
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	78 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	79 '-adj' ,'--adjusted',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	80 type = utils.Bool("adjusted"), default = False,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	81 help = 'Apply the FDR (Benjamini-Hochberg) correction (default: %(default)s)')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	82
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	83 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	84 '-fc', '--fChange',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	85 type = float,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	86 default = 1.5,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	87 help = 'Fold-Change threshold (default: %(default)s)')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	88
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	89 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	90 "-ne", "--net",
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	91 type = utils.Bool("net"), default = False,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	92 help = "choose if you want net enrichment for RPS")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	93
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	94 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	95 '-op', '--option',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	96 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	97 choices = ['datasets', 'dataset_class'],
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	98 help='dataset or dataset and class')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	99
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	100 #RAS:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	101 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	102 "-ra", "--using_RAS",
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	103 type = utils.Bool("using_RAS"), default = True,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	104 help = "choose whether to use RAS datasets.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	105
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	106 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	107 '-id', '--input_data',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	108 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	109 help = 'input dataset')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	110
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	111 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	112 '-ic', '--input_class',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	113 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	114 help = 'sample group specification')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	115
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	116 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	117 '-ids', '--input_datas',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	118 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	119 nargs = '+',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	120 help = 'input datasets')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	121
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	122 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	123 '-na', '--names',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	124 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	125 nargs = '+',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	126 help = 'input names')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	127
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	128 #RPS:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	129 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	130 "-rp", "--using_RPS",
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	131 type = utils.Bool("using_RPS"), default = False,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	132 help = "choose whether to use RPS datasets.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	133
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	134 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	135 '-idr', '--input_data_rps',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	136 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	137 help = 'input dataset rps')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	138
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	139 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	140 '-icr', '--input_class_rps',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	141 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	142 help = 'sample group specification rps')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	143
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	144 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	145 '-idsr', '--input_datas_rps',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	146 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	147 nargs = '+',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	148 help = 'input datasets rps')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	149
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	150 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	151 '-nar', '--names_rps',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	152 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	153 nargs = '+',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	154 help = 'input names rps')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	155
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	156 #Output:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	157 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	158 "-gs", "--generate_svg",
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	159 type = utils.Bool("generate_svg"), default = True,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	160 help = "choose whether to use RAS datasets.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	161
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	162 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	163 "-gp", "--generate_pdf",
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	164 type = utils.Bool("generate_pdf"), default = True,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	165 help = "choose whether to use RAS datasets.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	166
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	167 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	168 '-cm', '--custom_map',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	169 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	170 help='custom map to use')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	171
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	172 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	173 '-idop', '--output_path',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	174 type = str,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	175 default='result',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	176 help = 'output path for maps')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	177
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	178 parser.add_argument(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	179 '-mc', '--choice_map',
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	180 type = utils.Model, default = utils.Model.HMRcore,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	181 choices = [utils.Model.HMRcore, utils.Model.ENGRO2, utils.Model.Custom])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	182
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	183 args :argparse.Namespace = parser.parse_args(args)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	184 if args.using_RAS and not args.using_RPS: args.net = False
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	185
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	186 return args
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	187
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	188 ############################ dataset input ####################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	189 def read_dataset(data :str, name :str) -> pd.DataFrame:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	190 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	191 Tries to read the dataset from its path (data) as a tsv and turns it into a DataFrame.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	192
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	193 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	194 data : filepath of a dataset (from frontend input params or literals upon calling)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	195 name : name associated with the dataset (from frontend input params or literals upon calling)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	196
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	197 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	198 pd.DataFrame : dataset in a runtime operable shape
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	199
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	200 Raises:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	201 sys.exit : if there's no data (pd.errors.EmptyDataError) or if the dataset has less than 2 columns
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	202 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	203 try:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	204 dataset = pd.read_csv(data, sep = '\t', header = 0, engine='python')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	205 except pd.errors.EmptyDataError:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	206 sys.exit('Execution aborted: wrong format of ' + name + '\n')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	207 if len(dataset.columns) < 2:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	208 sys.exit('Execution aborted: wrong format of ' + name + '\n')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	209 return dataset
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	210
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	211 ############################ map_methods ######################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	212 FoldChange = Union[float, int, str] # Union[float, Literal[0, "-INF", "INF"]]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	213 def fold_change(avg1 :float, avg2 :float) -> FoldChange:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	214 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	215 Calculates the fold change between two gene expression values.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	216
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	217 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	218 avg1 : average expression value from one dataset avg2 : average expression value from the other dataset
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	219
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	220 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	221 FoldChange :
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	222 0 : when both input values are 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	223 "-INF" : when avg1 is 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	224 "INF" : when avg2 is 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	225 float : for any other combination of values
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	226 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	227 if avg1 == 0 and avg2 == 0:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	228 return 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	229
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	230 if avg1 == 0:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	231 return '-INF' # TODO: maybe fix
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	232
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	233 if avg2 == 0:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	234 return 'INF'
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	235
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	236 # (threshold_F_C - 1) / (abs(threshold_F_C) + 1) con threshold_F_C > 1
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	237 return (avg1 - avg2) / (abs(avg1) + abs(avg2))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	238
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	239 # TODO: I would really like for this one to get the Thanos treatment
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	240 def fix_style(l :str, col :Optional[str], width :str, dash :str) -> str:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	241 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	242 Produces a "fixed" style string to assign to a reaction arrow in the SVG map, assigning style properties to the corresponding values passed as input params.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	243
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	244 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	245 l : current style string of an SVG element
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	246 col : new value for the "stroke" style property
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	247 width : new value for the "stroke-width" style property
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	248 dash : new value for the "stroke-dasharray" style property
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	249
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	250 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	251 str : the fixed style string
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	252 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	253 tmp = l.split(';')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	254 flag_col = False
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	255 flag_width = False
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	256 flag_dash = False
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	257 for i in range(len(tmp)):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	258 if tmp[i].startswith('stroke:'):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	259 tmp[i] = 'stroke:' + col
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	260 flag_col = True
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	261 if tmp[i].startswith('stroke-width:'):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	262 tmp[i] = 'stroke-width:' + width
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	263 flag_width = True
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	264 if tmp[i].startswith('stroke-dasharray:'):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	265 tmp[i] = 'stroke-dasharray:' + dash
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	266 flag_dash = True
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	267 if not flag_col:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	268 tmp.append('stroke:' + col)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	269 if not flag_width:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	270 tmp.append('stroke-width:' + width)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	271 if not flag_dash:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	272 tmp.append('stroke-dasharray:' + dash)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	273 return ';'.join(tmp)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	274
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	275 def fix_map(d :Dict[str, List[Union[float, FoldChange]]], core_map :ET.ElementTree, threshold_P_V :float, threshold_F_C :float, max_z_score :float) -> ET.ElementTree:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	276 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	277 Edits the selected SVG map based on the p-value and fold change data (d) and some significance thresholds also passed as inputs.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	278
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	279 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	280 d : dictionary mapping a p-value and a fold-change value (values) to each reaction ID as encoded in the SVG map (keys)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	281 core_map : SVG map to modify
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	282 threshold_P_V : threshold for a p-value to be considered significant
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	283 threshold_F_C : threshold for a fold change value to be considered significant
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	284 max_z_score : highest z-score (absolute value)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	285
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	286 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	287 ET.ElementTree : the modified core_map
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	288
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	289 Side effects:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	290 core_map : mut
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	291 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	292 maxT = 12
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	293 minT = 2
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	294 grey = '#BEBEBE'
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	295 blue = '#6495ed'
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	296 red = '#ecac68'
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	297 for el in core_map.iter():
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	298 el_id = str(el.get('id'))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	299 if el_id.startswith('R_'):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	300 tmp = d.get(el_id[2:])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	301 if tmp != None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	302 p_val, f_c, z_score, avg1, avg2 = tmp
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	303
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	304 if math.isnan(p_val) or (isinstance(f_c, float) and math.isnan(f_c)): continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	305
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	306 if p_val <= threshold_P_V: # p-value is OK
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	307 if not isinstance(f_c, str): # FC is finite
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	308 if abs(f_c) < ((threshold_F_C - 1) / (abs(threshold_F_C) + 1)): # FC is not OK
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	309 col = grey
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	310 width = str(minT)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	311 else: # FC is OK
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	312 if f_c < 0:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	313 col = blue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	314 elif f_c > 0:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	315 col = red
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	316 width = str(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	317 min(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	318 max(abs(z_score * maxT) / max_z_score, minT),
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	319 maxT))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	320
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	321 else: # FC is infinite
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	322 if f_c == '-INF':
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	323 col = blue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	324 elif f_c == 'INF':
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	325 col = red
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	326 width = str(maxT)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	327 dash = 'none'
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	328 else: # p-value is not OK
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	329 dash = '5,5'
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	330 col = grey
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	331 width = str(minT)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	332 el.set('style', fix_style(el.get('style', ""), col, width, dash))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	333 return core_map
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	334
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	335 def getElementById(reactionId :str, metabMap :ET.ElementTree) -> utils.Result[ET.Element, utils.Result.ResultErr]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	336 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	337 Finds any element in the given map with the given ID. ID uniqueness in an svg file is recommended but
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	338 not enforced, if more than one element with the exact ID is found only the first will be returned.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	339
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	340 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	341 reactionId (str): exact ID of the requested element.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	342 metabMap (ET.ElementTree): metabolic map containing the element.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	343
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	344 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	345 utils.Result[ET.Element, ResultErr]: result of the search, either the first match found or a ResultErr.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	346 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	347 return utils.Result.Ok(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	348 f"//*[@id=\"{reactionId}\"]").map(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	349 lambda xPath : metabMap.xpath(xPath)[0]).mapErr(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	350 lambda _ : utils.Result.ResultErr(f"No elements with ID \"{reactionId}\" found in map"))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	351
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	352 def styleMapElement(element :ET.Element, styleStr :str) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	353 """Append/override stroke-related styles on a given SVG element."""
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	354 currentStyles :str = element.get("style", "")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	355 if re.search(r";stroke:[^;]+;stroke-width:[^;]+;stroke-dasharray:[^;]+$", currentStyles):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	356 currentStyles = ';'.join(currentStyles.split(';')[:-3])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	357
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	358 element.set("style", currentStyles + styleStr)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	359
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	360 class ReactionDirection(Enum):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	361 Unknown = ""
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	362 Direct = "_F"
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	363 Inverse = "_B"
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	364
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	365 @classmethod
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	366 def fromDir(cls, s :str) -> "ReactionDirection":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	367 # vvv as long as there's so few variants I actually condone the if spam:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	368 if s == ReactionDirection.Direct.value: return ReactionDirection.Direct
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	369 if s == ReactionDirection.Inverse.value: return ReactionDirection.Inverse
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	370 return ReactionDirection.Unknown
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	371
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	372 @classmethod
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	373 def fromReactionId(cls, reactionId :str) -> "ReactionDirection":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	374 return ReactionDirection.fromDir(reactionId[-2:])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	375
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	376 def getArrowBodyElementId(reactionId :str) -> str:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	377 """Return the SVG element id for a reaction arrow body, normalizing direction tags."""
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	378 if reactionId.endswith("_RV"): reactionId = reactionId[:-3] #TODO: standardize _RV
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	379 elif ReactionDirection.fromReactionId(reactionId) is not ReactionDirection.Unknown: reactionId = reactionId[:-2]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	380 return f"R_{reactionId}"
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	381
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	382 def getArrowHeadElementId(reactionId :str) -> Tuple[str, str]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	383 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	384 We attempt extracting the direction information from the provided reaction ID, if unsuccessful we provide the IDs of both directions.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	385
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	386 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	387 reactionId : the provided reaction ID.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	388
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	389 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	390 Tuple[str, str]: either a single str ID for the correct arrow head followed by an empty string or both options to try.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	391 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	392 if reactionId.endswith("_RV"): reactionId = reactionId[:-3] #TODO: standardize _RV
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	393 elif ReactionDirection.fromReactionId(reactionId) is not ReactionDirection.Unknown:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	394 return reactionId[:-3:-1] + reactionId[:-2], "" # ^^^ Invert _F to F_
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	395
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	396 return f"F_{reactionId}", f"B_{reactionId}"
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	397
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	398 class ArrowColor(Enum):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	399 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	400 Encodes possible arrow colors based on their meaning in the enrichment process.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	401 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	402 Invalid = "#BEBEBE" # gray, fold-change under treshold or not significant p-value
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	403 Transparent = "#ffffff00" # transparent, to make some arrow segments disappear
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	404 UpRegulated = "#ecac68" # orange, up-regulated reaction
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	405 DownRegulated = "#6495ed" # lightblue, down-regulated reaction
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	406
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	407 UpRegulatedInv = "#FF0000" # bright red for reversible with conflicting directions
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	408
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	409 DownRegulatedInv = "#0000FF" # bright blue for reversible with conflicting directions
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	410
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	411 @classmethod
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	412 def fromFoldChangeSign(cls, foldChange :float, *, useAltColor = False) -> "ArrowColor":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	413 colors = (cls.DownRegulated, cls.DownRegulatedInv) if foldChange < 0 else (cls.UpRegulated, cls.UpRegulatedInv)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	414 return colors[useAltColor]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	415
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	416 def __str__(self) -> str: return self.value
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	417
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	418 class Arrow:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	419 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	420 Models the properties of a reaction arrow that change based on enrichment.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	421 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	422 MIN_W = 2
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	423 MAX_W = 12
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	424
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	425 def __init__(self, width :int, col: ArrowColor, *, isDashed = False) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	426 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	427 (Private) Initializes an instance of Arrow.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	428
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	429 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	430 width : width of the arrow, ideally to be kept within Arrow.MIN_W and Arrow.MAX_W (not enforced).
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	431 col : color of the arrow.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	432 isDashed : whether the arrow should be dashed, meaning the associated pValue resulted not significant.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	433
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	434 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	435 None : practically, a Arrow instance.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	436 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	437 self.w = width
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	438 self.col = col
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	439 self.dash = isDashed
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	440
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	441 def applyTo(self, reactionId :str, metabMap :ET.ElementTree, styleStr :str) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	442 if getElementById(reactionId, metabMap).map(lambda el : styleMapElement(el, styleStr)).isErr:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	443 ERRORS.append(reactionId)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	444
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	445 def styleReactionElements(self, metabMap :ET.ElementTree, reactionId :str, *, mindReactionDir = True) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	446 # If direction is irrelevant (e.g., RAS), style only the arrow body
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	447 if not mindReactionDir:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	448 return self.applyTo(getArrowBodyElementId(reactionId), metabMap, self.toStyleStr())
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	449
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	450 # Now we style the arrow head(s):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	451 idOpt1, idOpt2 = getArrowHeadElementId(reactionId)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	452 self.applyTo(idOpt1, metabMap, self.toStyleStr(downSizedForTips = True))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	453 if idOpt2: self.applyTo(idOpt2, metabMap, self.toStyleStr(downSizedForTips = True))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	454
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	455 def toStyleStr(self, *, downSizedForTips = False) -> str:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	456 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	457 Collapses the styles of this Arrow into a str, ready to be applied as part of the "style" property on an svg element.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	458
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	459 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	460 str : the styles string.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	461 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	462 width = self.w
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	463 if downSizedForTips: width *= 0.8
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	464 return f";stroke:{self.col};stroke-width:{width};stroke-dasharray:{'5,5' if self.dash else 'none'}"
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	465
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	466 # Default arrows used for different significance states
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	467 INVALID_ARROW = Arrow(Arrow.MIN_W, ArrowColor.Invalid)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	468 INSIGNIFICANT_ARROW = Arrow(Arrow.MIN_W, ArrowColor.Invalid, isDashed = True)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	469 TRANSPARENT_ARROW = Arrow(Arrow.MIN_W, ArrowColor.Transparent) # Who cares how big it is if it's transparent
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	470
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	471 def applyRpsEnrichmentToMap(rpsEnrichmentRes :Dict[str, Union[Tuple[float, FoldChange], Tuple[float, FoldChange, float, float]]], metabMap :ET.ElementTree, maxNumericZScore :float) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	472 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	473 Applies RPS enrichment results to the provided metabolic map.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	474
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	475 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	476 rpsEnrichmentRes : RPS enrichment results.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	477 metabMap : the metabolic map to edit.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	478 maxNumericZScore : biggest finite z-score value found.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	479
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	480 Side effects:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	481 metabMap : mut
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	482
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	483 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	484 None
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	485 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	486 for reactionId, values in rpsEnrichmentRes.items():
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	487 pValue = values[0]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	488 foldChange = values[1]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	489 z_score = values[2]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	490
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	491 if math.isnan(pValue) or (isinstance(foldChange, float) and math.isnan(foldChange)): continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	492
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	493 if isinstance(foldChange, str): foldChange = float(foldChange)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	494 if pValue > ARGS.pValue: # pValue above tresh: dashed arrow
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	495 INSIGNIFICANT_ARROW.styleReactionElements(metabMap, reactionId)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	496 continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	497
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	498 if abs(foldChange) < (ARGS.fChange - 1) / (abs(ARGS.fChange) + 1):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	499 INVALID_ARROW.styleReactionElements(metabMap, reactionId)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	500 continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	501
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	502 width = Arrow.MAX_W
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	503 if not math.isinf(z_score):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	504 try: width = min(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	505 max(abs(z_score * Arrow.MAX_W) / maxNumericZScore, Arrow.MIN_W),
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	506 Arrow.MAX_W)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	507
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	508 except ZeroDivisionError: pass
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	509
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	510 if not reactionId.endswith("_RV"): # RV stands for reversible reactions
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	511 Arrow(width, ArrowColor.fromFoldChangeSign(foldChange)).styleReactionElements(metabMap, reactionId)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	512 continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	513
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	514 reactionId = reactionId[:-3] # Remove "_RV"
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	515
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	516 inversionScore = (values[3] < 0) + (values[4] < 0) # Compacts the signs of averages into 1 easy to check score
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	517 if inversionScore == 2: foldChange *= -1
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	518
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	519 # If the score is 1 (opposite signs) we use alternative colors vvv
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	520 arrow = Arrow(width, ArrowColor.fromFoldChangeSign(foldChange, useAltColor = inversionScore == 1))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	521
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	522 # vvv These 2 if statements can both be true and can both happen
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	523 if ARGS.net: # style arrow head(s):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	524 arrow.styleReactionElements(metabMap, reactionId + ("_B" if inversionScore == 2 else "_F"))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	525
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	526 if not ARGS.using_RAS: # style arrow body
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	527 arrow.styleReactionElements(metabMap, reactionId, mindReactionDir = False)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	528
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	529 ############################ split class ######################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	530 def split_class(classes :pd.DataFrame, dataset_values :Dict[str, List[float]]) -> Dict[str, List[List[float]]]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	531 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	532 Generates a :dict that groups together data from a :DataFrame based on classes the data is related to.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	533
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	534 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	535 classes : a :DataFrame of only string values, containing class information (rows) and keys to query the resolve_rules :dict
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	536 dataset_values : a :dict containing :float data
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	537
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	538 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	539 dict : the dict with data grouped by class
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	540
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	541 Side effects:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	542 classes : mut
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	543 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	544 class_pat :Dict[str, List[List[float]]] = {}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	545 for i in range(len(classes)):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	546 classe :str = classes.iloc[i, 1]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	547 if pd.isnull(classe): continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	548
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	549 l :List[List[float]] = []
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	550 sample_ids: List[str] = []
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	551
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	552 for j in range(i, len(classes)):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	553 if classes.iloc[j, 1] == classe:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	554 pat_id :str = classes.iloc[j, 0] # sample name
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	555 values = dataset_values.get(pat_id, None) # the column of values for that sample
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	556 if values != None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	557 l.append(values)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	558 sample_ids.append(pat_id)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	559 classes.iloc[j, 1] = None # TODO: problems?
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	560
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	561 if l:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	562 class_pat[classe] = {
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	563 "values": list(map(list, zip(*l))), # transpose
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	564 "samples": sample_ids
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	565 }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	566 continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	567
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	568 utils.logWarning(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	569 f"Warning: no sample found in class \"{classe}\", the class has been disregarded", ARGS.out_log)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	570
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	571 return class_pat
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	572
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	573 ############################ conversion ##############################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	574 # Conversion from SVG to PNG
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	575 def svg_to_png_with_background(svg_path :utils.FilePath, png_path :utils.FilePath, dpi :int = 72, scale :int = 1, size :Optional[float] = None) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	576 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	577 Internal utility to convert an SVG to PNG (forced opaque) to aid in PDF conversion.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	578
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	579 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	580 svg_path : path to SVG file
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	581 png_path : path for new PNG file
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	582 dpi : dots per inch of the generated PNG
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	583 scale : scaling factor for the generated PNG, computed internally when a size is provided
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	584 size : final effective width of the generated PNG
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	585
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	586 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	587 None
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	588 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	589 if size:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	590 image = pyvips.Image.new_from_file(svg_path.show(), dpi=dpi, scale=1)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	591 scale = size / image.width
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	592 image = image.resize(scale)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	593 else:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	594 image = pyvips.Image.new_from_file(svg_path.show(), dpi=dpi, scale=scale)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	595
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	596 white_background = pyvips.Image.black(image.width, image.height).new_from_image([255, 255, 255])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	597 white_background = white_background.affine([scale, 0, 0, scale])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	598
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	599 if white_background.bands != image.bands:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	600 white_background = white_background.extract_band(0)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	601
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	602 composite_image = white_background.composite2(image, 'over')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	603 composite_image.write_to_file(png_path.show())
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	604
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	605 def convert_to_pdf(file_svg :utils.FilePath, file_png :utils.FilePath, file_pdf :utils.FilePath) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	606 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	607 Converts the SVG map at the provided path to PDF.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	608
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	609 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	610 file_svg : path to SVG file
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	611 file_png : path to PNG file
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	612 file_pdf : path to new PDF file
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	613
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	614 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	615 None
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	616 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	617 svg_to_png_with_background(file_svg, file_png)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	618 try:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	619 image = Image.open(file_png.show())
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	620 image = image.convert("RGB")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	621 image.save(file_pdf.show(), "PDF", resolution=100.0)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	622 print(f'PDF file {file_pdf.filePath} successfully generated.')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	623
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	624 except Exception as e:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	625 raise utils.DataErr(file_pdf.show(), f'Error generating PDF file: {e}')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	626
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	627 ############################ map ##############################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	628 def buildOutputPath(dataset1Name :str, dataset2Name = "rest", *, details = "", ext :utils.FileFormat) -> utils.FilePath:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	629 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	630 Builds a FilePath instance from the names of confronted datasets ready to point to a location in the
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	631 "result/" folder, used by this tool for output files in collections.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	632
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	633 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	634 dataset1Name : _description_
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	635 dataset2Name : _description_. Defaults to "rest".
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	636 details : _description_
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	637 ext : _description_
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	638
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	639 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	640 utils.FilePath : _description_
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	641 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	642 return utils.FilePath(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	643 f"{dataset1Name}_vs_{dataset2Name}" + (f" ({details})" if details else ""),
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	644 ext,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	645 prefix = ARGS.output_path)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	646
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	647 FIELD_NOT_AVAILABLE = '/'
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	648 def writeToCsv(rows: List[list], fieldNames :List[str], outPath :utils.FilePath) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	649 fieldsAmt = len(fieldNames)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	650 with open(outPath.show(), "w", newline = "") as fd:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	651 writer = csv.DictWriter(fd, fieldnames = fieldNames, delimiter = '\t')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	652 writer.writeheader()
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	653
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	654 for row in rows:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	655 sizeMismatch = fieldsAmt - len(row)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	656 if sizeMismatch > 0: row.extend([FIELD_NOT_AVAILABLE] * sizeMismatch)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	657 writer.writerow({ field : data for field, data in zip(fieldNames, row) })
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	658
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	659 OldEnrichedScores = Dict[str, List[Union[float, FoldChange]]]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	660 def temp_thingsInCommon(tmp :OldEnrichedScores, core_map :ET.ElementTree, max_z_score :float, dataset1Name :str, dataset2Name = "rest", ras_enrichment = True) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	661 suffix = "RAS" if ras_enrichment else "RPS"
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	662 writeToCsv(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	663 [ [reactId] + values for reactId, values in tmp.items() ],
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	664 ["ids", "P_Value", "fold change", "z-score", "average_1", "average_2"],
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	665 buildOutputPath(dataset1Name, dataset2Name, details = f"Tabular Result ({suffix})", ext = utils.FileFormat.TSV))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	666
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	667 if ras_enrichment:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	668 fix_map(tmp, core_map, ARGS.pValue, ARGS.fChange, max_z_score)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	669 return
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	670
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	671 for reactId, enrichData in tmp.items(): tmp[reactId] = tuple(enrichData)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	672 applyRpsEnrichmentToMap(tmp, core_map, max_z_score)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	673
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	674 def computePValue(dataset1Data: List[float], dataset2Data: List[float]) -> Tuple[float, float]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	675 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	676 Computes the statistical significance score (P-value) of the comparison between coherent data
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	677 from two datasets. The data is supposed to, in both datasets:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	678 - be related to the same reaction ID;
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	679 - be ordered by sample, such that the item at position i in both lists is related to the
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	680 same sample or cell line.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	681
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	682 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	683 dataset1Data : data from the 1st dataset.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	684 dataset2Data : data from the 2nd dataset.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	685
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	686 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	687 tuple: (P-value, Z-score)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	688 - P-value from the selected test on the provided data.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	689 - Z-score of the difference between means of the two datasets.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	690 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	691 match ARGS.test:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	692 case "ks":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	693 # Perform Kolmogorov-Smirnov test
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	694 _, p_value = st.ks_2samp(dataset1Data, dataset2Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	695 case "ttest_p":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	696 # Datasets should have same size
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	697 if len(dataset1Data) != len(dataset2Data):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	698 raise ValueError("Datasets must have the same size for paired t-test.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	699 # Perform t-test for paired samples
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	700 _, p_value = st.ttest_rel(dataset1Data, dataset2Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	701 case "ttest_ind":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	702 # Perform t-test for independent samples
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	703 _, p_value = st.ttest_ind(dataset1Data, dataset2Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	704 case "wilcoxon":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	705 # Datasets should have same size
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	706 if len(dataset1Data) != len(dataset2Data):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	707 raise ValueError("Datasets must have the same size for Wilcoxon signed-rank test.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	708 # Perform Wilcoxon signed-rank test
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	709 np.random.seed(42) # Ensure reproducibility since zsplit method is used
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	710 _, p_value = st.wilcoxon(dataset1Data, dataset2Data, zero_method='zsplit')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	711 case "mw":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	712 # Perform Mann-Whitney U test
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	713 _, p_value = st.mannwhitneyu(dataset1Data, dataset2Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	714 case _:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	715 p_value = np.nan # Default value if no valid test is selected
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	716
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	717 # Calculate means and standard deviations
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	718 mean1 = np.mean(dataset1Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	719 mean2 = np.mean(dataset2Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	720 std1 = np.std(dataset1Data, ddof=1)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	721 std2 = np.std(dataset2Data, ddof=1)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	722
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	723 n1 = len(dataset1Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	724 n2 = len(dataset2Data)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	725
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	726 # Calculate Z-score
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	727 z_score = (mean1 - mean2) / np.sqrt((std12 / n1) + (std22 / n2))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	728
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	729 return p_value, z_score
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	730
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	731
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	732 def DESeqPValue(comparisonResult :Dict[str, List[Union[float, FoldChange]]], dataset1Data :List[List[float]], dataset2Data :List[List[float]], ids :List[str]) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	733 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	734 Computes the p-value for each reaction in the comparisonResult dictionary using DESeq2.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	735
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	736 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	737 comparisonResult : dictionary mapping a p-value and a fold-change value (values) to each reaction ID as encoded in the SVG map (keys)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	738 dataset1Data : data from the 1st dataset.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	739 dataset2Data : data from the 2nd dataset.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	740 ids : list of reaction IDs.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	741
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	742 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	743 None : mutates the comparisonResult dictionary in place with the p-values.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	744 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	745
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	746 # pyDESeq2 needs at least 2 replicates per sample so I check this
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	747 if len(dataset1Data[0]) < 2 or len(dataset2Data[0]) < 2:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	748 raise ValueError("Datasets must have at least 2 replicates each")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	749
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	750 # pyDESeq2 is based on pandas, so we need to convert the data into a DataFrame and clean it from NaN values
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	751 dataframe1 = pd.DataFrame(dataset1Data, index=ids)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	752 dataframe2 = pd.DataFrame(dataset2Data, index=ids)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	753
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	754 # pyDESeq2 requires datasets to be samples x reactions and integer values
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	755 dataframe1_clean = dataframe1.dropna(axis=0, how="any").T.astype(int)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	756 dataframe2_clean = dataframe2.dropna(axis=0, how="any").T.astype(int)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	757 dataframe1_clean.index = [f"ds1_rep{i+1}" for i in range(dataframe1_clean.shape[0])]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	758 dataframe2_clean.index = [f"ds2_rep{j+1}" for j in range(dataframe2_clean.shape[0])]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	759
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	760 # pyDESeq2 works on a DataFrame with values and another with infos about how samples are split (like dataset class)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	761 dataframe = pd.concat([dataframe1_clean, dataframe2_clean], axis=0)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	762 metadata = pd.DataFrame({"dataset": (["dataset1"]dataframe1_clean.shape[0] + ["dataset2"]dataframe2_clean.shape[0])}, index=dataframe.index)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	763
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	764 # Ensure the index of the metadata matches the index of the dataframe
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	765 if not dataframe.index.equals(metadata.index):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	766 raise ValueError("The index of the metadata DataFrame must match the index of the counts DataFrame.")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	767
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	768 # Prepare and run pyDESeq2
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	769 inference = DefaultInference()
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	770 dds = DeseqDataSet(counts=dataframe, metadata=metadata, design="~dataset", inference=inference, quiet=True, low_memory=True)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	771 dds.deseq2()
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	772 ds = DeseqStats(dds, contrast=["dataset", "dataset1", "dataset2"], inference=inference, quiet=True)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	773 ds.summary()
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	774
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	775 # Retrieve the p-values from the DESeq2 results
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	776 for reactId in ds.results_df.index:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	777 comparisonResult[reactId][0] = ds.results_df["pvalue"][reactId]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	778
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	779
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	780 # TODO: the net RPS computation should be done in the RPS module
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	781 def compareDatasetPair(dataset1Data :List[List[float]], dataset2Data :List[List[float]], ids :List[str]) -> Tuple[Dict[str, List[Union[float, FoldChange]]], float, Dict[str, Tuple[np.ndarray, np.ndarray]]]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	782
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	783 netRPS :Dict[str, Tuple[np.ndarray, np.ndarray]] = {}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	784 comparisonResult :Dict[str, List[Union[float, FoldChange]]] = {}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	785 count = 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	786 max_z_score = 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	787
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	788 for l1, l2 in zip(dataset1Data, dataset2Data):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	789 reactId = ids[count]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	790 count += 1
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	791 if not reactId: continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	792
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	793 try: #TODO: identify the source of these errors and minimize code in the try block
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	794 reactDir = ReactionDirection.fromReactionId(reactId)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	795 # Net score is computed only for reversible reactions when user wants it on arrow tips or when RAS datasets aren't used
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	796 if (ARGS.net or not ARGS.using_RAS) and reactDir is not ReactionDirection.Unknown:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	797 try: position = ids.index(reactId[:-1] + ('B' if reactDir is ReactionDirection.Direct else 'F'))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	798 except ValueError: continue # we look for the complementary id, if not found we skip
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	799
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	800 nets1 = np.subtract(l1, dataset1Data[position])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	801 nets2 = np.subtract(l2, dataset2Data[position])
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	802 netRPS[reactId] = (nets1, nets2)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	803
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	804 # Compute p-value and z-score for the RPS scores, if the pyDESeq option is set, p-values will be computed after and this function will return p_value = 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	805 p_value, z_score = computePValue(nets1, nets2)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	806 avg1 = sum(nets1) / len(nets1)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	807 avg2 = sum(nets2) / len(nets2)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	808 net = fold_change(avg1, avg2)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	809
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	810 if math.isnan(net): continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	811 comparisonResult[reactId[:-1] + "RV"] = [p_value, net, z_score, avg1, avg2]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	812
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	813 # vvv complementary directional ids are set to None once processed if net is to be applied to tips
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	814 if ARGS.net: # If only using RPS, we cannot delete the inverse, as it's needed to color the arrows
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	815 ids[position] = None
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	816 continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	817
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	818 # fallthrough is intended, regular scores need to be computed when tips aren't net but RAS datasets aren't used
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	819 # Compute p-value and z-score for the RAS scores, if the pyDESeq option is set, p-values will be computed after and this function will return p_value = 0
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	820 p_value, z_score = computePValue(l1, l2)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	821 avg = fold_change(sum(l1) / len(l1), sum(l2) / len(l2))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	822 # vvv TODO: Check numpy version compatibility
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	823 if np.isfinite(z_score) and max_z_score < abs(z_score): max_z_score = abs(z_score)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	824 comparisonResult[reactId] = [float(p_value), avg, z_score, sum(l1) / len(l1), sum(l2) / len(l2)]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	825
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	826 except (TypeError, ZeroDivisionError): continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	827
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	828 if ARGS.test == "DESeq":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	829 # Compute p-values using DESeq2
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	830 DESeqPValue(comparisonResult, dataset1Data, dataset2Data, ids)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	831
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	832 # Apply multiple testing correction if set by the user
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	833 if ARGS.adjusted:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	834
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	835 # Retrieve the p-values from the comparisonResult dictionary, they have to be different from NaN
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	836 validPValues = [(reactId, result[0]) for reactId, result in comparisonResult.items() if not np.isnan(result[0])]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	837 # Unpack the valid p-values
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	838 reactIds, pValues = zip(*validPValues)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	839 # Adjust the p-values using the Benjamini-Hochberg method
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	840 adjustedPValues = st.false_discovery_control(pValues)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	841 # Update the comparisonResult dictionary with the adjusted p-values
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	842 for reactId , adjustedPValue in zip(reactIds, adjustedPValues):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	843 comparisonResult[reactId][0] = adjustedPValue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	844
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	845 return comparisonResult, max_z_score, netRPS
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	846
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	847 def computeEnrichment(class_pat: Dict[str, List[List[float]]], ids: List[str], *, fromRAS=True) -> Tuple[List[Tuple[str, str, dict, float]], dict]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	848 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	849 Compares clustered data based on a given comparison mode and applies enrichment-based styling on the
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	850 provided metabolic map.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	851
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	852 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	853 class_pat : the clustered data.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	854 ids : ids for data association.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	855 fromRAS : whether the data to enrich consists of RAS scores.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	856
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	857 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	858 tuple: A tuple containing:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	859 - List[Tuple[str, str, dict, float]]: List of tuples with pairs of dataset names, comparison dictionary and max z-score.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	860 - dict : net RPS values for each dataset's reactions
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	861
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	862 Raises:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	863 sys.exit : if there are less than 2 classes for comparison
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	864 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	865 class_pat = {k.strip(): v for k, v in class_pat.items()}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	866 if (not class_pat) or (len(class_pat.keys()) < 2):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	867 sys.exit('Execution aborted: classes provided for comparisons are less than two\n')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	868
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	869 # { datasetName : { reactId : netRPS, ... }, ... }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	870 netRPSResults :Dict[str, Dict[str, np.ndarray]] = {}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	871 enrichment_results = []
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	872
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	873 if ARGS.comparison == "manyvsmany":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	874 for i, j in it.combinations(class_pat.keys(), 2):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	875 comparisonDict, max_z_score, netRPS = compareDatasetPair(class_pat.get(i), class_pat.get(j), ids)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	876 enrichment_results.append((i, j, comparisonDict, max_z_score))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	877 netRPSResults[i] = { reactId : net[0] for reactId, net in netRPS.items() }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	878 netRPSResults[j] = { reactId : net[1] for reactId, net in netRPS.items() }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	879
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	880 elif ARGS.comparison == "onevsrest":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	881 for single_cluster in class_pat.keys():
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	882 rest = [item for k, v in class_pat.items() if k != single_cluster for item in v]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	883 comparisonDict, max_z_score, netRPS = compareDatasetPair(class_pat.get(single_cluster), rest, ids)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	884 enrichment_results.append((single_cluster, "rest", comparisonDict, max_z_score))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	885 netRPSResults[single_cluster] = { reactId : net[0] for reactId, net in netRPS.items() }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	886 netRPSResults["rest"] = { reactId : net[1] for reactId, net in netRPS.items() }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	887
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	888 elif ARGS.comparison == "onevsmany":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	889 controlItems = class_pat.get(ARGS.control)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	890 for otherDataset in class_pat.keys():
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	891 if otherDataset == ARGS.control:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	892 continue
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	893
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	894 #comparisonDict, max_z_score, netRPS = compareDatasetPair(controlItems, class_pat.get(otherDataset), ids)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	895 comparisonDict, max_z_score, netRPS = compareDatasetPair(class_pat.get(otherDataset),controlItems, ids)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	896 #enrichment_results.append((ARGS.control, otherDataset, comparisonDict, max_z_score))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	897 enrichment_results.append(( otherDataset,ARGS.control, comparisonDict, max_z_score))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	898 netRPSResults[otherDataset] = { reactId : net[0] for reactId, net in netRPS.items() }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	899 netRPSResults[ARGS.control] = { reactId : net[1] for reactId, net in netRPS.items() }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	900
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	901 return enrichment_results, netRPSResults
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	902
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	903 def createOutputMaps(dataset1Name: str, dataset2Name: str, core_map: ET.ElementTree) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	904 svgFilePath = buildOutputPath(dataset1Name, dataset2Name, details="SVG Map", ext=utils.FileFormat.SVG)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	905 utils.writeSvg(svgFilePath, core_map)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	906
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	907 if ARGS.generate_pdf:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	908 pngPath = buildOutputPath(dataset1Name, dataset2Name, details="PNG Map", ext=utils.FileFormat.PNG)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	909 pdfPath = buildOutputPath(dataset1Name, dataset2Name, details="PDF Map", ext=utils.FileFormat.PDF)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	910 svg_to_png_with_background(svgFilePath, pngPath)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	911 try:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	912 image = Image.open(pngPath.show())
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	913 image = image.convert("RGB")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	914 image.save(pdfPath.show(), "PDF", resolution=100.0)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	915 print(f'PDF file {pdfPath.filePath} successfully generated.')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	916
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	917 except Exception as e:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	918 raise utils.DataErr(pdfPath.show(), f'Error generating PDF file: {e}')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	919
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	920 if not ARGS.generate_svg:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	921 os.remove(svgFilePath.show())
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	922
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	923 ClassPat = Dict[str, List[List[float]]]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	924 def getClassesAndIdsFromDatasets(datasetsPaths :List[str], datasetPath :str, classPath :str, names :List[str]) -> Tuple[List[str], ClassPat, Dict[str, List[str]]]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	925 columnNames :Dict[str, List[str]] = {} # { datasetName : [ columnName, ... ], ... }
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	926 class_pat :ClassPat = {}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	927 if ARGS.option == 'datasets':
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	928 num = 1
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	929 for path, name in zip(datasetsPaths, names):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	930 name = str(name)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	931 if name == 'Dataset':
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	932 name += '_' + str(num)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	933
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	934 values, ids = getDatasetValues(path, name)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	935 if values != None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	936 class_pat[name] = list(map(list, zip(*values.values()))) # TODO: ???
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	937 columnNames[name] = ["Reactions", *values.keys()]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	938
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	939 num += 1
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	940
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	941 elif ARGS.option == "dataset_class":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	942 classes = read_dataset(classPath, "class")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	943 classes = classes.astype(str)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	944
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	945 values, ids = getDatasetValues(datasetPath, "Dataset Class (not actual name)")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	946 if values != None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	947 class_pat_with_samples_id = split_class(classes, values)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	948
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	949 for clas, values_and_samples_id in class_pat_with_samples_id.items():
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	950 class_pat[clas] = values_and_samples_id["values"]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	951 columnNames[clas] = ["Reactions", *values_and_samples_id["samples"]]
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	952
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	953 return ids, class_pat, columnNames
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	954
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	955 def getDatasetValues(datasetPath :str, datasetName :str) -> Tuple[ClassPat, List[str]]:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	956 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	957 Opens the dataset at the given path and extracts the values (expected nullable numerics) and the IDs.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	958
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	959 Args:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	960 datasetPath : path to the dataset
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	961 datasetName (str): dataset name, used in error reporting
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	962
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	963 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	964 Tuple[ClassPat, List[str]]: values and IDs extracted from the dataset
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	965 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	966 dataset = read_dataset(datasetPath, datasetName)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	967 IDs = pd.Series.tolist(dataset.iloc[:, 0].astype(str))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	968
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	969 dataset = dataset.drop(dataset.columns[0], axis = "columns").to_dict("list")
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	970 return { id : list(map(utils.Float("Dataset values, not an argument"), values)) for id, values in dataset.items() }, IDs
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	971
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	972 ############################ MAIN #############################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	973 def main(args:List[str] = None) -> None:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	974 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	975 Initializes everything and sets the program in motion based on the fronted input arguments.
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	976
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	977 Returns:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	978 None
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	979
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	980 Raises:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	981 sys.exit : if a user-provided custom map is in the wrong format (ET.XMLSyntaxError, ET.XMLSchemaParseError)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	982 """
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	983 global ARGS
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	984 ARGS = process_args(args)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	985
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	986 # Create output folder
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	987 if not os.path.isdir(ARGS.output_path):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	988 os.makedirs(ARGS.output_path, exist_ok=True)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	989
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	990 core_map: ET.ElementTree = ARGS.choice_map.getMap(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	991 ARGS.tool_dir,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	992 utils.FilePath.fromStrPath(ARGS.custom_map) if ARGS.custom_map else None)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	993
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	994 # Prepare enrichment results containers
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	995 ras_results = []
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	996 rps_results = []
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	997
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	998 # Compute RAS enrichment if requested
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	999 if ARGS.using_RAS:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1000 ids_ras, class_pat_ras, _ = getClassesAndIdsFromDatasets(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1001 ARGS.input_datas, ARGS.input_data, ARGS.input_class, ARGS.names)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1002 ras_results, _ = computeEnrichment(class_pat_ras, ids_ras, fromRAS=True)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1003
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1004
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1005 # Compute RPS enrichment if requested
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1006 if ARGS.using_RPS:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1007 ids_rps, class_pat_rps, columnNames = getClassesAndIdsFromDatasets(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1008 ARGS.input_datas_rps, ARGS.input_data_rps, ARGS.input_class_rps, ARGS.names_rps)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1009
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1010 rps_results, netRPS = computeEnrichment(class_pat_rps, ids_rps, fromRAS=False)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1011
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1012 # Organize by comparison pairs
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1013 comparisons: Dict[Tuple[str, str], Dict[str, Tuple]] = {}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1014 for i, j, comparison_data, max_z_score in ras_results:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1015 comparisons[(i, j)] = {'ras': (comparison_data, max_z_score), 'rps': None}
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1016
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1017 for i, j, comparison_data, max_z_score, in rps_results:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1018 comparisons.setdefault((i, j), {}).update({'rps': (comparison_data, max_z_score)})
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1019
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1020 # For each comparison, create a styled map with RAS bodies and RPS heads
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1021 for (i, j), res in comparisons.items():
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1022 map_copy = copy.deepcopy(core_map)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1023
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1024 # Apply RAS styling to arrow bodies
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1025 if res.get('ras'):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1026 tmp_ras, max_z_ras = res['ras']
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1027 temp_thingsInCommon(tmp_ras, map_copy, max_z_ras, i, j, ras_enrichment=True)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1028
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1029 # Apply RPS styling to arrow heads
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1030 if res.get('rps'):
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1031 tmp_rps, max_z_rps = res['rps']
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1032
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1033 temp_thingsInCommon(tmp_rps, map_copy, max_z_rps, i, j, ras_enrichment=False)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1034
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1035 # Output both SVG and PDF/PNG as configured
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1036 createOutputMaps(i, j, map_copy)
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1037
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1038 # Add net RPS output file
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1039 if ARGS.net or not ARGS.using_RAS:
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1040 for datasetName, rows in netRPS.items():
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1041 writeToCsv(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1042 [[reactId, *netValues] for reactId, netValues in rows.items()],
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1043 columnNames.get(datasetName, ["Reactions"]),
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1044 utils.FilePath(
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1045 "Net_RPS_" + datasetName,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1046 ext = utils.FileFormat.CSV,
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1047 prefix = ARGS.output_path))
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1048
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1049 print('Execution succeeded')
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1050 ###############################################################################
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1051 if __name__ == "__main__":
2fb97466e404 Uploaded francesco_lapi parents: diff changeset	1052 main()

Mercurial > repos > bimib > cobraxy

annotate COBRAxy/src/marea.py @ 539:2fb97466e404 draft