cobraxy: COBRAxy/utils/general

annotate COBRAxy/utils/general_utils.py @ 454:3654c08668f1 draft default tip

Uploaded

author	francesco_lapi
date	Thu, 11 Sep 2025 21:02:09 +0000
parents	4a385fdb9e58
children

rev	line source
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	1 import math
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	2 import re
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	3 import sys
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	4 import csv
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	5 import pickle
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	6 import lxml.etree as ET
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	7
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	8 from enum import Enum
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	9 from itertools import count
408 f413b78d61bf Uploaded francesco_lapi parents: 394 diff changeset	10 from typing import Any, Callable, Dict, Generic, List, Literal, Optional, TypeVar, Union, Set, Tuple
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	11
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	12 import pandas as pd
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	13 import cobra
409 71850bdf9e1e Uploaded francesco_lapi parents: 408 diff changeset	14 from cobra import Model as cobraModel, Reaction, Metabolite
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	15
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	16 import zipfile
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	17 import gzip
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	18 import bz2
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	19 from io import StringIO
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	20
394 a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	21
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	22
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	23 class ValueErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	24 def __init__(self, param_name, expected, actual):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	25 super().__init__(f"Invalid value for {param_name}: expected {expected}, got {actual}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	26
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	27 class PathErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	28 def __init__(self, path, message):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	29 super().__init__(f"Path error for '{path}': {message}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	30
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	31 class FileFormat(Enum):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	32 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	33 Encodes possible file extensions to conditionally save data in a different format.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	34 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	35 DAT = ("dat",) # this is how galaxy treats all your files!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	36 CSV = ("csv",) # this is how most editable input data is written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	37 TSV = ("tsv",) # this is how most editable input data is ACTUALLY written TODO:more support pls!!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	38 SVG = ("svg",) # this is how most metabolic maps are written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	39 PNG = ("png",) # this is a common output format for images (such as metabolic maps)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	40 PDF = ("pdf",) # this is also a common output format for images, as it's required in publications.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	41
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	42 # Updated to include compressed variants
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	43 XML = ("xml", "xml.gz", "xml.zip", "xml.bz2") # SBML files are XML files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	44 JSON = ("json", "json.gz", "json.zip", "json.bz2") # COBRA models can be stored as JSON files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	45 MAT = ("mat", "mat.gz", "mat.zip", "mat.bz2") # COBRA models can be stored as MAT files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	46 YML = ("yml", "yml.gz", "yml.zip", "yml.bz2") # COBRA models can be stored as YML files, sometimes compressed
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	47
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	48 TXT = ("txt",) # this is how most output data is written
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	49 PICKLE = ("pickle", "pk", "p") # this is how all runtime data structures are saved
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	50
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	51 def __init__(self, *extensions):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	52 self.extensions = extensions
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	53 # Store original extension when set via fromExt
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	54 self._original_extension = None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	55
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	56 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	57 def fromExt(cls, ext: str) -> "FileFormat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	58 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	59 Converts a file extension string to a FileFormat instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	60 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	61 ext : The file extension as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	62 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	63 FileFormat: The FileFormat instance corresponding to the file extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	64 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	65 variantName = ext.upper()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	66 if variantName in FileFormat.__members__:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	67 instance = FileFormat[variantName]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	68 instance._original_extension = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	69 return instance
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	70
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	71 variantName = ext.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	72 for member in cls:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	73 if variantName in member.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	74 # Create a copy-like behavior by storing the original extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	75 member._original_extension = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	76 return member
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	77
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	78 raise ValueErr("ext", "a valid FileFormat file extension", ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	79
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	80 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	81 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	82 (Private) converts to str representation. Good practice for usage with argparse.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	83 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	84 str : the string representation of the file extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	85 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	86 # If we have an original extension stored (for compressed files only), use it
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	87 if hasattr(self, '_original_extension') and self._original_extension:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	88 return self._original_extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	89
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	90 # For XML, JSON, MAT and YML without original extension, use the base extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	91 if self == FileFormat.XML:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	92 return "xml"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	93 elif self == FileFormat.JSON:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	94 return "json"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	95 elif self == FileFormat.MAT:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	96 return "mat"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	97 elif self == FileFormat.YML:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	98 return "yml"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	99
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	100 return self.value[-1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	101
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	102 class FilePath():
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	103 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	104 Represents a file path. View this as an attempt to standardize file-related operations by expecting
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	105 values of this type in any process requesting a file path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	106 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	107 def __init__(self, filePath: str, ext: FileFormat, *, prefix="") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	108 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	109 (Private) Initializes an instance of FilePath.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	110 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	111 path : the end of the path, containing the file name.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	112 ext : the file's extension.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	113 prefix : anything before path, if the last '/' isn't there it's added by the code.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	114 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	115 None : practically, a FilePath instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	116 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	117 self.ext = ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	118 self.filePath = filePath
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	119
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	120 if prefix and prefix[-1] != '/':
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	121 prefix += '/'
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	122 self.prefix = prefix
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	123
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	124 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	125 def fromStrPath(cls, path: str) -> "FilePath":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	126 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	127 Factory method to parse a string from which to obtain, if possible, a valid FilePath instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	128 It detects double extensions such as .json.gz and .xml.bz2, which are common in COBRA models.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	129 These double extensions are not supported for other file types such as .csv.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	130 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	131 path : the string containing the path
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	132 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	133 PathErr : if the provided string doesn't represent a valid path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	134 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	135 FilePath : the constructed instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	136 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	137 result = re.search(r"^(?P<prefix>.\/)?(?P<name>.)\.(?P<ext>[^.]*)$", path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	138 if not result or not result["name"] or not result["ext"]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	139 raise PathErr(path, "cannot recognize folder structure or extension in path")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	140
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	141 prefix = result["prefix"] if result["prefix"] else ""
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	142 name, ext = result["name"], result["ext"]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	143
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	144 # Check for double extensions (json.gz, xml.zip, etc.)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	145 parts = path.split(".")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	146 if len(parts) >= 3:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	147 penultimate = parts[-2]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	148 last = parts[-1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	149 double_ext = f"{penultimate}.{last}"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	150
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	151 # Try the double extension first
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	152 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	153 ext_format = FileFormat.fromExt(double_ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	154 name = ".".join(parts[:-2])
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	155 # Extract prefix if it exists
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	156 if '/' in name:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	157 prefix = name[:name.rfind('/') + 1]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	158 name = name[name.rfind('/') + 1:]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	159 return cls(name, ext_format, prefix=prefix)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	160 except ValueErr:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	161 # If double extension doesn't work, fall back to single extension
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	162 pass
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	163
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	164 # Single extension fallback (original logic)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	165 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	166 ext_format = FileFormat.fromExt(ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	167 return cls(name, ext_format, prefix=prefix)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	168 except ValueErr:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	169 raise PathErr(path, f"unsupported file extension: {ext}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	170
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	171 def show(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	172 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	173 Shows the path as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	174 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	175 str : the path shown as a string.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	176 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	177 return f"{self.prefix}{self.filePath}.{self.ext}"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	178
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	179 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	180 return self.show()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	181
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	182 # ERRORS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	183 def terminate(msg :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	184 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	185 Terminate the execution of the script with an error message.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	186
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	187 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	188 msg (str): The error message to be displayed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	189
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	190 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	191 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	192 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	193 sys.exit(f"Execution aborted: {msg}\n")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	194
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	195 def logWarning(msg :str, loggerPath :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	196 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	197 Log a warning message to an output log file and print it to the console. The final period and a
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	198 newline is added by the function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	199
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	200 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	201 s (str): The warning message to be logged and printed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	202 loggerPath : The file path of the output log file. Given as a string, parsed to a FilePath and
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	203 immediately read back (beware relative expensive operation, log with caution).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	204
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	205 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	206 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	207 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	208 # building the path and then reading it immediately seems useless, but it's actually a way of
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	209 # validating that reduces repetition on the caller's side. Besides, logging a message by writing
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	210 # to a file is supposed to be computationally expensive anyway, so this is also a good deterrent from
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	211 # mindlessly logging whenever something comes up, log at the very end and tell the user everything
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	212 # that went wrong. If you don't like it: implement a persistent runtime buffer that gets dumped to
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	213 # the file only at the end of the program's execution.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	214 with open(FilePath.fromStrPath(loggerPath).show(), 'a') as log: log.write(f"{msg}.\n")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	215
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	216 class CustomErr(Exception):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	217 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	218 Custom error class to handle exceptions in a structured way, with a unique identifier and a message.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	219 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	220 __idGenerator = count()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	221 errName = "Custom Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	222 def __init__(self, msg :str, details = "", explicitErrCode = -1) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	223 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	224 (Private) Initializes an instance of CustomErr.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	225
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	226 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	227 msg (str): Error message to be displayed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	228 details (str): Informs the user more about the error encountered. Defaults to "".
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	229 explicitErrCode (int): Explicit error code to be used. Defaults to -1.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	230
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	231 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	232 None : practically, a CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	233 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	234 self.msg = msg
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	235 self.details = details
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	236
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	237 self.id = max(explicitErrCode, next(CustomErr.__idGenerator))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	238
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	239 def throw(self, loggerPath = "") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	240 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	241 Raises the current CustomErr instance, logging a warning message before doing so.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	242
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	243 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	244 self: The current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	245
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	246 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	247 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	248 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	249 if loggerPath: logWarning(str(self), loggerPath)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	250 raise self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	251
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	252 def abort(self) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	253 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	254 Aborts the execution of the script.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	255
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	256 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	257 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	258 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	259 terminate(str(self))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	260
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	261 def __str__(self) -> str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	262 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	263 (Private) Returns a string representing the current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	264
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	265 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	266 str: A string representing the current CustomErr instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	267 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	268 return f"{CustomErr.errName} #{self.id}: {self.msg}, {self.details}."
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	269
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	270 class ArgsErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	271 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	272 CustomErr subclass for UI arguments errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	273 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	274 errName = "Args Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	275 def __init__(self, argName :str, expected :Any, actual :Any, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	276 super().__init__(f"argument \"{argName}\" expected {expected} but got {actual}", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	277
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	278 class DataErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	279 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	280 CustomErr subclass for data formatting errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	281 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	282 errName = "Data Format Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	283 def __init__(self, fileName :str, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	284 super().__init__(f"file \"{fileName}\" contains malformed data", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	285
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	286 class PathErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	287 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	288 CustomErr subclass for filepath formatting errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	289 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	290 errName = "Path Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	291 def __init__(self, path :FilePath, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	292 super().__init__(f"path \"{path}\" is invalid", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	293
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	294 class ValueErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	295 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	296 CustomErr subclass for any value error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	297 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	298 errName = "Value Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	299 def __init__(self, valueName: str, expected :Any, actual :Any, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	300 super().__init__("value " + f"\"{valueName}\" " * bool(valueName) + f"was supposed to be {expected}, but got {actual} instead", msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	301
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	302 # RESULT
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	303 T = TypeVar('T')
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	304 E = TypeVar('E', bound = CustomErr) # should bind to Result.ResultErr but python happened!
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	305 class Result(Generic[T, E]):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	306 class ResultErr(CustomErr):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	307 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	308 CustomErr subclass for all Result errors.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	309 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	310 errName = "Result Error"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	311 def __init__(self, msg = "no further details provided") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	312 super().__init__(msg)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	313 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	314 Class to handle the result of an operation, with a value and a boolean flag to indicate
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	315 whether the operation was successful or not.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	316 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	317 def __init__(self, value :Union[T, E], isOk :bool) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	318 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	319 (Private) Initializes an instance of Result.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	320
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	321 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	322 value (Union[T, E]): The value to be stored in the Result instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	323 isOk (bool): A boolean flag to indicate whether the operation was successful or not.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	324
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	325 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	326 None : practically, a Result instance.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	327 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	328 self.isOk = isOk
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	329 self.isErr = not isOk
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	330 self.value = value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	331
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	332 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	333 def Ok(cls, value :T) -> "Result":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	334 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	335 Constructs a new Result instance with a successful operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	336
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	337 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	338 value (T): The value to be stored in the Result instance, set as successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	339
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	340 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	341 Result: A new Result instance with a successful operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	342 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	343 return Result(value, isOk = True)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	344
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	345 @classmethod
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	346 def Err(cls, value :E) -> "Result":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	347 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	348 Constructs a new Result instance with a failed operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	349
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	350 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	351 value (E): The value to be stored in the Result instance, set as failed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	352
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	353 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	354 Result: A new Result instance with a failed operation.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	355 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	356 return Result(value, isOk = False)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	357
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	358 def unwrap(self) -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	359 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	360 Unwraps the value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	361
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	362 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	363 ResultErr: If the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	364
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	365 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	366 T: The value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	367 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	368 if self.isOk: return self.value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	369 raise Result.ResultErr(f"Unwrapped Result.Err : {self.value}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	370
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	371 def unwrapOr(self, default :T) -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	372 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	373 Unwraps the value of the Result instance, if the operation was successful, otherwise
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	374 it returns a default value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	375
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	376 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	377 default (T): The default value to be returned if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	378
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	379 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	380 T: The value of the Result instance, if the operation was successful,
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	381 otherwise the default value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	382 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	383 return self.value if self.isOk else default
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	384
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	385 def expect(self, err :"Result.ResultErr") -> T:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	386 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	387 Expects that the value of the Result instance is successful, otherwise it raises an error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	388
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	389 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	390 err (Exception): The error to be raised if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	391
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	392 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	393 err: The error raised if the operation was not successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	394
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	395 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	396 T: The value of the Result instance, if the operation was successful.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	397 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	398 if self.isOk: return self.value
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	399 raise err
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	400
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	401 U = TypeVar("U")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	402 def map(self, mapper: Callable[[T], U]) -> "Result[U, E]":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	403 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	404 Maps the value of the current Result to whatever is returned by the mapper function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	405 If the Result contained an unsuccessful operation to begin with it remains unchanged
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	406 (a reference to the current instance is returned).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	407 If the mapper function panics the returned result instance will be of the error kind.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	408
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	409 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	410 mapper (Callable[[T], U]): The mapper operation to be applied to the Result value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	411
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	412 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	413 Result[U, E]: The result of the mapper operation applied to the Result value.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	414 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	415 if self.isErr: return self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	416 try: return Result.Ok(mapper(self.value))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	417 except Exception as e: return Result.Err(e)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	418
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	419 D = TypeVar("D", bound = "Result.ResultErr")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	420 def mapErr(self, mapper :Callable[[E], D]) -> "Result[T, D]":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	421 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	422 Maps the error of the current Result to whatever is returned by the mapper function.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	423 If the Result contained a successful operation it remains unchanged
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	424 (a reference to the current instance is returned).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	425 If the mapper function panics this method does as well.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	426
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	427 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	428 mapper (Callable[[E], D]): The mapper operation to be applied to the Result error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	429
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	430 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	431 Result[U, E]: The result of the mapper operation applied to the Result error.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	432 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	433 if self.isOk: return self
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	434 return Result.Err(mapper(self.value))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	435
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	436 def __str__(self):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	437 return f"Result::{'Ok' if self.isOk else 'Err'}({self.value})"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	438
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	439 # FILES
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	440 def read_dataset(path :FilePath, datasetName = "Dataset (not actual file name!)") -> pd.DataFrame:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	441 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	442 Reads a .csv or .tsv file and returns it as a Pandas DataFrame.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	443
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	444 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	445 path : the path to the dataset file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	446 datasetName : the name of the dataset.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	447
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	448 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	449 DataErr: If anything goes wrong when trying to open the file, if pandas thinks the dataset is empty or if
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	450 it has less than 2 columns.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	451
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	452 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	453 pandas.DataFrame: The dataset loaded as a Pandas DataFrame.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	454 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	455 # I advise against the use of this function. This is an attempt at standardizing bad legacy code rather than
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	456 # removing / replacing it to avoid introducing as many bugs as possible in the tools still relying on this code.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	457 # First off, this is not the best way to distinguish between .csv and .tsv files and Galaxy itself makes it really
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	458 # hard to implement anything better. Also, this function's name advertizes it as a dataset-specific operation and
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	459 # contains dubious responsibility (how many columns..) while being a file-opening function instead. My suggestion is
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	460 # TODO: stop using dataframes ever at all in anything and find a way to have tight control over file extensions.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	461 try: dataset = pd.read_csv(path.show(), sep = '\t', header = None, engine = "python")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	462 except:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	463 try: dataset = pd.read_csv(path.show(), sep = ',', header = 0, engine = "python")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	464 except Exception as err: raise DataErr(datasetName, f"encountered empty or wrongly formatted data: {err}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	465
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	466 if len(dataset.columns) < 2: raise DataErr(datasetName, "a dataset is always meant to have at least 2 columns")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	467 return dataset
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	468
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	469 def readPickle(path :FilePath) -> Any:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	470 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	471 Reads the contents of a .pickle file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	472
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	473 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	474 path : the path to the .pickle file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	475
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	476 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	477 Any : the data inside a pickle file, could be anything.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	478 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	479 with open(path.show(), "rb") as fd: return pickle.load(fd)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	480
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	481 def writePickle(path :FilePath, data :Any) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	482 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	483 Saves any data in a .pickle file, created at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	484
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	485 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	486 path : the path to the .pickle file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	487 data : the data to be written to the file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	488
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	489 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	490 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	491 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	492 with open(path.show(), "wb") as fd: pickle.dump(data, fd)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	493
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	494 def readCsv(path :FilePath, delimiter = ',', *, skipHeader = True) -> List[List[str]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	495 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	496 Reads the contents of a .csv file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	497
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	498 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	499 path : the path to the .csv file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	500 delimiter : allows other subformats such as .tsv to be opened by the same method (\\t delimiter).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	501 skipHeader : whether the first row of the file is a header and should be skipped.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	502
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	503 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	504 List[List[str]] : list of rows from the file, each parsed as a list of strings originally separated by commas.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	505 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	506 with open(path.show(), "r", newline = "") as fd: return list(csv.reader(fd, delimiter = delimiter))[skipHeader:]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	507
427 4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	508 def findIdxByName(header: List[str], name: str, colName="name") -> Optional[int]:
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	509 """
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	510 Find the indices of the 'ReactionID' column and a user-specified column name
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	511 within the header row of a tabular file.
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	512
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	513 Args:
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	514 header (List[str]): The header row, as a list of column names.
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	515 name (str): The name of the column to look for (e.g. 'GPR').
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	516 colName (str, optional): Label used in error messages for clarity. Defaults to "name".
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	517
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	518 Returns:
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	519 Tuple[int, int]: A tuple containing:
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	520 - The index of the 'ReactionID' column.
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	521 - The index of the requested column `name`.
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	522
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	523 Raises:
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	524 ValueError: If 'ReactionID' or the requested column `name` is not found in the header.
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	525
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	526 Notes:
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	527 Both 'ReactionID' and the requested column are mandatory for downstream processing.
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	528 """
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	529
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	530 col_index = {col_name: idx for idx, col_name in enumerate(header)}
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	531
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	532 if name not in col_index or "ReactionID" not in col_index:
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	533 raise ValueError(f"Tabular file must contain 'ReactionID' and {name} columns.")
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	534
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	535 id_idx = col_index["ReactionID"]
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	536 idx_gpr = col_index[name]
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	537
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	538 return id_idx, idx_gpr
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	539
4a385fdb9e58 Uploaded francesco_lapi parents: 419 diff changeset	540
392 f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	541 def readSvg(path :FilePath, customErr :Optional[Exception] = None) -> ET.ElementTree:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	542 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	543 Reads the contents of a .svg file, which needs to exist at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	544
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	545 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	546 path : the path to the .svg file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	547
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	548 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	549 DataErr : if the map is malformed.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	550
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	551 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	552 Any : the data inside a svg file, could be anything.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	553 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	554 try: return ET.parse(path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	555 except (ET.XMLSyntaxError, ET.XMLSchemaParseError) as err:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	556 raise customErr if customErr else err
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	557
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	558 def writeSvg(path :FilePath, data:ET.ElementTree) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	559 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	560 Saves svg data opened with lxml.etree in a .svg file, created at the given path.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	561
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	562 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	563 path : the path to the .svg file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	564 data : the data to be written to the file.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	565
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	566 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	567 None
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	568 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	569 with open(path.show(), "wb") as fd: fd.write(ET.tostring(data))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	570
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	571 # UI ARGUMENTS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	572 class Bool:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	573 def __init__(self, argName :str) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	574 self.argName = argName
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	575
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	576 def __call__(self, s :str) -> bool: return self.check(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	577
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	578 def check(self, s :str) -> bool:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	579 s = s.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	580 if s == "true" : return True
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	581 if s == "false": return False
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	582 raise ArgsErr(self.argName, "boolean string (true or false, not case sensitive)", f"\"{s}\"")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	583
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	584 class Float:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	585 def __init__(self, argName = "Dataset values, not an argument") -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	586 self.argName = argName
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	587
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	588 def __call__(self, s :str) -> float: return self.check(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	589
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	590 def check(self, s :str) -> float:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	591 try: return float(s)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	592 except ValueError:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	593 s = s.lower()
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	594 if s == "nan" or s == "none": return math.nan
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	595 raise ArgsErr(self.argName, "numeric string or \"None\" or \"NaN\" (not case sensitive)", f"\"{s}\"")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	596
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	597 # MODELS
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	598 OldRule = List[Union[str, "OldRule"]]
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	599 class Model(Enum):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	600 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	601 Represents a metabolic model, either custom or locally supported. Custom models don't point
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	602 to valid file paths.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	603 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	604
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	605 Recon = "Recon"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	606 ENGRO2 = "ENGRO2"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	607 ENGRO2_no_legend = "ENGRO2_no_legend"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	608 HMRcore = "HMRcore"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	609 HMRcore_no_legend = "HMRcore_no_legend"
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	610 Custom = "Custom" # Exists as a valid variant in the UI, but doesn't point to valid file paths.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	611
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	612 def __raiseMissingPathErr(self, path :Optional[FilePath]) -> None:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	613 if not path: raise PathErr("<<MISSING>>", "it's necessary to provide a custom path when retrieving files from a custom model")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	614
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	615 def getRules(self, toolDir :str, customPath :Optional[FilePath] = None) -> Dict[str, Dict[str, OldRule]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	616 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	617 Open "rules" file for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	618
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	619 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	620 Dict[str, Dict[str, OldRule]] : the rules for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	621 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	622 path = customPath if self is Model.Custom else FilePath(f"{self.name}_rules", FileFormat.PICKLE, prefix = f"{toolDir}/local/pickle files/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	623 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	624 return readPickle(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	625
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	626 def getTranslator(self, toolDir :str, customPath :Optional[FilePath] = None) -> Dict[str, Dict[str, str]]:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	627 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	628 Open "gene translator (old: gene_in_rule)" file for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	629
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	630 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	631 Dict[str, Dict[str, str]] : the translator dict for this model.
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	632 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	633 path = customPath if self is Model.Custom else FilePath(f"{self.name}_genes", FileFormat.PICKLE, prefix = f"{toolDir}/local/pickle files/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	634 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	635 return readPickle(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	636
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	637 def getMap(self, toolDir = ".", customPath :Optional[FilePath] = None) -> ET.ElementTree:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	638 path = customPath if self is Model.Custom else FilePath(f"{self.name}_map", FileFormat.SVG, prefix = f"{toolDir}/local/svg metabolic maps/")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	639 self.__raiseMissingPathErr(path)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	640 return readSvg(path, customErr = DataErr(path, f"custom map in wrong format"))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	641
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	642 def getCOBRAmodel(self, toolDir = ".", customPath :Optional[FilePath] = None, customExtension :Optional[FilePath]=None)->cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	643 if(self is Model.Custom):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	644 return self.load_custom_model(customPath, customExtension)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	645 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	646 return cobra.io.read_sbml_model(FilePath(f"{self.name}", FileFormat.XML, prefix = f"{toolDir}/local/models/").show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	647
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	648 def load_custom_model(self, file_path :FilePath, ext :Optional[FileFormat] = None) -> cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	649 ext = ext if ext else file_path.ext
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	650 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	651 if str(ext) in FileFormat.XML.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	652 return cobra.io.read_sbml_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	653
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	654 if str(ext) in FileFormat.JSON.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	655 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	656 if(ext == "json"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	657 return cobra.io.load_json_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	658 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	659 return self.extract_model(file_path, ext, "json")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	660
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	661 if str(ext) in FileFormat.MAT.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	662 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	663 if(ext == "mat"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	664 return cobra.io.load_matlab_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	665 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	666 return self.extract_model(file_path, ext, "mat")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	667
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	668 if str(ext) in FileFormat.YML.value:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	669 # Compressed files are not automatically handled by cobra
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	670 if(ext == "yml"):
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	671 return cobra.io.load_yaml_model(file_path.show())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	672 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	673 return self.extract_model(file_path, ext, "yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	674
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	675 except Exception as e: raise DataErr(file_path, e.__str__())
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	676 raise DataErr(file_path,
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	677 f"Fomat \"{file_path.ext}\" is not recognized, only JSON, XML, MAT and YAML (.yml) files are supported.")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	678
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	679
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	680 def extract_model(self, file_path:FilePath, ext :FileFormat, model_encoding:Literal["json", "mat", "yml"]) -> cobra.Model:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	681 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	682 Extract JSON, MAT and YAML COBRA model from a compressed file (zip, gz, bz2).
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	683
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	684 Args:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	685 file_path: File path of the model
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	686 ext: File extensions of class FileFormat (should be .zip, .gz or .bz2)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	687
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	688 Returns:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	689 cobra.Model: COBRApy model
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	690
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	691 Raises:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	692 Exception: Extraction errors
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	693 """
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	694 ext_str = str(ext)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	695
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	696 try:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	697 if '.zip' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	698 with zipfile.ZipFile(file_path.show(), 'r') as zip_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	699 with zip_ref.open(zip_ref.namelist()[0]) as json_file:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	700 content = json_file.read().decode('utf-8')
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	701 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	702 return cobra.io.load_json_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	703 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	704 return cobra.io.load_matlab_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	705 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	706 return cobra.io.load_yaml_model(StringIO(content))
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	707 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	708 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	709 elif '.gz' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	710 with gzip.open(file_path.show(), 'rt', encoding='utf-8') as gz_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	711 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	712 return cobra.io.load_json_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	713 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	714 return cobra.io.load_matlab_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	715 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	716 return cobra.io.load_yaml_model(gz_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	717 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	718 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	719 elif '.bz2' in ext_str:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	720 with bz2.open(file_path.show(), 'rt', encoding='utf-8') as bz2_ref:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	721 if model_encoding == "json":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	722 return cobra.io.load_json_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	723 elif model_encoding == "mat":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	724 return cobra.io.load_matlab_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	725 elif model_encoding == "yml":
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	726 return cobra.io.load_yaml_model(bz2_ref)
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	727 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	728 raise ValueError(f"Unsupported model encoding: {model_encoding}. Supported: json, mat, yml")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	729 else:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	730 raise ValueError(f"Compression format not supported: {ext_str}. Supported: .zip, .gz and .bz2")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	731
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	732 except Exception as e:
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	733 raise Exception(f"Error during model extraction: {str(e)}")
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	734
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	735
f73d57641124 Uploaded francesco_lapi parents: 391 diff changeset	736
394 a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	737 def __str__(self) -> str: return self.value
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	738
a0b53ccc73a8 Uploaded francesco_lapi parents: 392 diff changeset	739

Mercurial > repos > bimib > cobraxy

annotate COBRAxy/utils/general_utils.py @ 454:3654c08668f1 draft default tip