primo_multiomics: term_mapper.xml annotate

author	pieter.lukasse@wur.nl
date	Mon, 23 Mar 2015 21:02:01 +0100
parents
children	97e10319d86f

rev	line source
7 ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	1 <tool name="TermMapperTool" id="TermMapperTool1" version="0.0.2">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	2 <description>use cross-reference lookup tables to annotate results</description>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	3 <!--
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	4 For remote debugging start you listener on port 8000 and use the following as command interpreter:
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	5 java -jar -Xdebug -Xrunjdwp:transport=dt_socket,address=D0100564.wurnet.nl:8000
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	6 -->
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	7 <!-- similar to "join two datasets" tool http://galaxy.wur.nl/galaxy_production/root?tool_id=join1
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	8 but this one is probably having more powerful features like supporting multiple ';' codes in key fields
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	9 and the feature in termColName(s) supporting direct hierarchy like annotation -->
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	10 <command interpreter="java -jar ">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	11 TermMapperTool.jar
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	12 -inputFileName $inputFileName
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	13 -inputIdColumnName "$inputIdColumnName"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	14 #if $inputIdCol.inputIdHasPrefix == True
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	15 -inputIdPrefix "$inputIdCol.inputIdPrefix"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	16 #end if
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	17
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	18 -mappingFileName $mappingFileName
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	19 -mappingFileIdColName "$mappingFileIdColName"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	20
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	21 #if $mappingIdCol.mappingIdHasPrefix == True
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	22 -mappingIdPrefix "$mappingIdCol.mappingIdPrefix"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	23 #end if
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	24
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	25 -mappingFileTermColName "$mappingFileTermColName"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	26
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	27 -outputFileName $outputFileName
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	28
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	29 #if $genObservations.genObservationsFile == True
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	30 -outputObservationsFileName $outputObservationsFileName
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	31 -quantifColumn "$genObservations.quantifColumn"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	32 #end if
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	33
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	34 -mappedTermsColName $mappedTermsColName
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	35
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	36 </command>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	37
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	38 <inputs>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	39
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	40 <param name="inputFileName" type="data" format="tabular,csv" label="Target file (TSV/CSV)" />
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	41
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	42 <param name="inputIdColumnName" type="text" size="50" value="" label="ID column name"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	43 help="Name of the column containing the identification codes (in the given input file)"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	44
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	45 <conditional name="inputIdCol">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	46 <param name="inputIdHasPrefix" type="boolean" truevalue="Yes" falsevalue="No" checked="false"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	47 label="ID values have a prefix"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	48 <when value="Yes">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	49 <param name="inputIdPrefix" type="text" size="50" value="" label="Prefix in ID column"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	50 help="Fill in if any prefix is found in the ID column values (e.g. in some
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	51 files the value is preceded by a fixed value like for example 'lipidmaps:LMFA00000007' instead of just 'LMFA00000007' - in this
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	52 example one would fill in 'lipidmaps:' as prefix)"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	53 </when>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	54 <when value="No">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	55 </when>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	56 </conditional>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	57
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	58 <!-- =================== cross-reference part ============== -->
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	59 <param name="mappingFileName" type="data" format="tabular,csv" label="Lookup table (TSV/CSV)" help="Simple mapping file between the coding scheme used to another scheme"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	60 <param name="mappingFileIdColName" type="text" size="50" value="" label="ID column name (in lookup table)" help="Name of the ID column for the lookup"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	61
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	62 <conditional name="mappingIdCol">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	63 <param name="mappingIdHasPrefix" type="boolean" truevalue="Yes" falsevalue="No" checked="false"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	64 label="ID values have a prefix"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	65 <when value="Yes">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	66 <param name="mappingIdPrefix" type="text" size="50" value="" label="Prefix in ID column"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	67 help="Fill in if any prefix is found in the ID column values (e.g. in some
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	68 files the value is preceded by a fixed value like for example 'lipidmaps:LMFA00000007' instead of just 'LMFA00000007' - in this
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	69 example one would fill in 'lipidmaps:' as prefix)"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	70 </when>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	71 <when value="No">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	72 </when>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	73 </conditional>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	74
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	75 <param name="mappingFileTermColName" type="text" size="50" value="" label="Term column name(s) or number(s)"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	76 help="Name(s) or number(s) of the column(s) containing the term(s) in the lookup table (and which will be transfered to the target file based on ID match in 'ID column name').
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	77 For using multiple term column names, set the names separated by comma (,).
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	78 If multiple columns are specified, the algorithm will look for an annotation in the first one, if none
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	79 found it will try the second one, and so forth. "/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	80
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	81
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	82 <param name="mappedTermsColName" type="text" size="50" value="Mapped terms" label="Name to give to the new column:"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	83 help="Name to give to the new column that will be added to the target file. This new column is the one
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	84 that will contain the respectively mapped terms."/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	85
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	86 <conditional name="genObservations">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	87 <param name="genObservationsFile" type="boolean" truevalue="Yes" falsevalue="No" checked="false"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	88 label="Generate also observations file"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	89 <when value="Yes">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	90 <param name="quantifColumn" type="text" size="50" value=""
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	91 label="(Optional) Values column name"
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	92 help="Name of the column containing the quantification values (in the given input file)"/>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	93 </when>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	94 <when value="No">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	95 </when>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	96 </conditional>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	97
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	98 </inputs>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	99 <outputs>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	100 #if isinstance( $inputFileName.datatype, $__app__.datatypes_registry.get_datatype_by_extension('tabular').__class__):
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	101 <data name="outputFileName" format="tabular" label="${tool.name} on ${on_string}: annotated file " ></data>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	102 #else:
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	103 <data name="outputFileName" format="csv" label="${tool.name} on ${on_string}: annotated file " ></data>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	104 #end if
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	105
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	106 <data name="outputObservationsFileName" format="tabular" label="${tool.name} on ${on_string}: term observations file (TSV)">
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	107 <!-- If the expression is false, the file is not created -->
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	108 <filter>( genObservations.genObservationsFile == True )</filter>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	109 </data>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	110 </outputs>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	111 <tests>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	112 <!-- find out how to use -->
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	113 <test>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	114 </test>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	115 </tests>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	116 <help>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	117
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	118 .. class:: infomark
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	119
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	120
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	121 This tool is responsible for annotating the given target file
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	122 with the terms given in a lookup table. This lookup table maps the items found in the target file
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	123 (e.g. protein identifications coded in common protein coding formats such as UniProt )
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	124 to their respective terms (e.g. GO terms). It enables users to use the cross-reference
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	125 information now available from different repositories (like uniprot and KEGG - see for example
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	126 http://www.uniprot.org/taxonomy/ or http://www.genome.jp/linkdb/ )
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	127 to map their data to other useful coding schemes or to ontologies and functional annotations.
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	128
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	129 .. class:: infomark
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	130
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	131 NB: Currently the tool will do "smart parsing" of hierarchy based fields in the target file ID column.
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	132 This means that if the colum contains a ".", the trailing part of the ID after the "." is ignored if the full
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	133 ID does not get a match in the lookup table while the part before the "." does.
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	134
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	135 .. class:: infomark
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	136
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	137 Examples of usage:
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	138
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	139 annotate protein identifications with Gene Ontology[GO] terms
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	140
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	141 annotate metabolite CAS identifications with chebi codes
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	142
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	143 add KEGG gene codes to a file containing UNIPROT codes
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	144
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	145 add KEGG compound codes to a file containing chebi codes
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	146
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	147 etc
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	148
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	149 As an example for transcripts and proteins, users can check http://www.uniprot.org/taxonomy/ to
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	150 see if their organism has been mapped to GO terms by Uniprot. For example the link
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	151 http://www.uniprot.org/uniprot/?query=taxonomy:2850 will show the Uniprot repository and cross-references
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	152 for the taxonomy 2850.
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	153 When the organism being studied is not available, then other strategies
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	154 could be tried (like Blast2GO for example).
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	155
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	156 Despite the specific examples above, this class is generic and can be used to map any
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	157 values to new terms according to a given lookup table.
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	158
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	159 .. class:: infomark
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	160
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	161 Omics cross-reference resources on the web:
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	162
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	163 LinkDB: http://www.genome.jp/linkdb/
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	164
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	165 Ready to use metabolomics links:
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	166
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	167 http://rest.genome.jp/link/compound/chebi
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	168
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	169 http://rest.genome.jp/link/compound/lipidmaps
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	170
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	171 http://rest.genome.jp/link/compound/lipidbank
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	172
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	173 http://rest.genome.jp/link/compound/hmdb
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	174
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	175
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	176 Ready to use proteomics links:
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	177
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	178 http://rest.genome.jp/link/uniprot/pti (Phaeodactylum Tri.)
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	179
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	180 http://rest.genome.jp/link/uniprot/hsa (Homo Sapiens)
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	181
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	182 (for organism code list see: )
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	183
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	184
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	185 Uniprot to GO
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	186
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	187 http://www.uniprot.org/taxonomy/
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	188
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	189
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	190 -----
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	191
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	192 Output
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	193
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	194 This method will read in the given input file and for each line it will add a new column
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	195 containing the terms found for the ID in that line. So the output file is the same as the
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	196 input file + extra terms column (separated by ; ).
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	197
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	198 -----
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	199
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	200 Link to ontology viewer
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	201
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	202 A second summarized "terms observations" file can also be generated.
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	203 In case the terms are ontology terms, this file can be used for visualizing the results
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	204 in the ontology viewer "OntologyAndObservationsViewer".
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	205
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	206 </help>
ce9228263148 renamed to TermMapper pieter.lukasse@wur.nl parents: diff changeset	207 </tool>

7

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

1 <tool name="TermMapperTool" id="TermMapperTool1" version="0.0.2">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

2 <description>use cross-reference lookup tables to annotate results</description>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

3 <!--

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

4 For remote debugging start you listener on port 8000 and use the following as command interpreter:

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

5 java -jar -Xdebug -Xrunjdwp:transport=dt_socket,address=D0100564.wurnet.nl:8000

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

6 -->

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

7 <!-- similar to "join two datasets" tool http://galaxy.wur.nl/galaxy_production/root?tool_id=join1

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

8 but this one is probably having more powerful features like supporting multiple ';' codes in key fields

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

9 and the feature in termColName(s) supporting direct hierarchy like annotation -->

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

10 <command interpreter="java -jar ">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

11 TermMapperTool.jar

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

12 -inputFileName $inputFileName

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

13 -inputIdColumnName "$inputIdColumnName"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

14 #if $inputIdCol.inputIdHasPrefix == True

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

15 -inputIdPrefix "$inputIdCol.inputIdPrefix"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

16 #end if

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

17

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

18 -mappingFileName $mappingFileName

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

19 -mappingFileIdColName "$mappingFileIdColName"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

20

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

21 #if $mappingIdCol.mappingIdHasPrefix == True

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

22 -mappingIdPrefix "$mappingIdCol.mappingIdPrefix"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

23 #end if

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

24

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

25 -mappingFileTermColName "$mappingFileTermColName"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

26

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

27 -outputFileName $outputFileName

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

28

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

29 #if $genObservations.genObservationsFile == True

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

30 -outputObservationsFileName $outputObservationsFileName

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

31 -quantifColumn "$genObservations.quantifColumn"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

32 #end if

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

33

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

34 -mappedTermsColName $mappedTermsColName

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

35

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

36 </command>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

37

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

38 <inputs>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

39

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

40 <param name="inputFileName" type="data" format="tabular,csv" label="Target file (TSV/CSV)" />

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

41

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

42 <param name="inputIdColumnName" type="text" size="50" value="" label="ID column name"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

43 help="Name of the column containing the identification codes (in the given input file)"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

44

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

45 <conditional name="inputIdCol">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

46 <param name="inputIdHasPrefix" type="boolean" truevalue="Yes" falsevalue="No" checked="false"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

47 label="ID values have a prefix"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

48 <when value="Yes">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

49 <param name="inputIdPrefix" type="text" size="50" value="" label="Prefix in ID column"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

50 help="Fill in if any prefix is found in the ID column values (e.g. in some

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

51 files the value is preceded by a fixed value like for example 'lipidmaps:LMFA00000007' instead of just 'LMFA00000007' - in this

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

52 example one would fill in 'lipidmaps:' as prefix)"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

53 </when>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

54 <when value="No">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

55 </when>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

56 </conditional>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

57

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

58

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

59 <param name="mappingFileName" type="data" format="tabular,csv" label="Lookup table (TSV/CSV)" help="Simple mapping file between the coding scheme used to another scheme"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

60 <param name="mappingFileIdColName" type="text" size="50" value="" label="ID column name (in lookup table)" help="Name of the ID column for the lookup"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

61

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

62 <conditional name="mappingIdCol">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

63 <param name="mappingIdHasPrefix" type="boolean" truevalue="Yes" falsevalue="No" checked="false"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

64 label="ID values have a prefix"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

65 <when value="Yes">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

66 <param name="mappingIdPrefix" type="text" size="50" value="" label="Prefix in ID column"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

67 help="Fill in if any prefix is found in the ID column values (e.g. in some

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

68 files the value is preceded by a fixed value like for example 'lipidmaps:LMFA00000007' instead of just 'LMFA00000007' - in this

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

69 example one would fill in 'lipidmaps:' as prefix)"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

70 </when>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

71 <when value="No">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

72 </when>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

73 </conditional>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

74

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

75 <param name="mappingFileTermColName" type="text" size="50" value="" label="Term column name(s) or number(s)"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

76 help="Name(s) or number(s) of the column(s) containing the term(s) in the lookup table (and which will be transfered to the target file based on ID match in 'ID column name').

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

77 For using multiple term column names, set the names separated by comma (,).

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

78 If multiple columns are specified, the algorithm will look for an annotation in the first one, if none

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

79 found it will try the second one, and so forth. "/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

80

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

81

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

82 <param name="mappedTermsColName" type="text" size="50" value="Mapped terms" label="Name to give to the new column:"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

83 help="Name to give to the new column that will be added to the target file. This new column is the one

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

84 that will contain the respectively mapped terms."/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

85

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

86 <conditional name="genObservations">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

87 <param name="genObservationsFile" type="boolean" truevalue="Yes" falsevalue="No" checked="false"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

88 label="Generate also observations file"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

89 <when value="Yes">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

90 <param name="quantifColumn" type="text" size="50" value=""

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

91 label="(Optional) Values column name"

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

92 help="Name of the column containing the quantification values (in the given input file)"/>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

93 </when>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

94 <when value="No">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

95 </when>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

96 </conditional>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

97

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

98 </inputs>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

99 <outputs>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

100 #if isinstance( $inputFileName.datatype, $__app__.datatypes_registry.get_datatype_by_extension('tabular').__class__):

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

101 <data name="outputFileName" format="tabular" label="${tool.name} on ${on_string}: annotated file " ></data>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

102 #else:

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

103 <data name="outputFileName" format="csv" label="${tool.name} on ${on_string}: annotated file " ></data>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

104 #end if

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

105

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

106 <data name="outputObservationsFileName" format="tabular" label="${tool.name} on ${on_string}: term observations file (TSV)">

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

107

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

108 <filter>( genObservations.genObservationsFile == True )</filter>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

109 </data>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

110 </outputs>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

111 <tests>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

112

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

113 <test>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

114 </test>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

115 </tests>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

116 <help>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

117

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

118 .. class:: infomark

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

119

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

120

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

121 This tool is responsible for annotating the given target file

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

122 with the terms given in a lookup table. This lookup table maps the items found in the target file

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

123 (e.g. protein identifications coded in common protein coding formats such as UniProt )

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

124 to their respective terms (e.g. GO terms). It enables users to use the cross-reference

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

125 information now available from different repositories (like uniprot and KEGG - see for example

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

126 http://www.uniprot.org/taxonomy/ or http://www.genome.jp/linkdb/ )

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

127 to map their data to other useful coding schemes or to ontologies and functional annotations.

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

128

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

129 .. class:: infomark

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

130

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

131 **NB:** Currently the tool will do "smart parsing" of hierarchy based fields in the target file ID column.

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

132 This means that if the colum contains a ".", the trailing part of the ID after the "." is ignored if the full

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

133 ID does not get a match in the lookup table while the part before the "." does.

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

134

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

135 .. class:: infomark

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

136

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

137 Examples of usage:

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

138

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

139 annotate protein identifications with Gene Ontology[GO] terms

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

140

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

141 annotate metabolite CAS identifications with chebi codes

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

142

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

143 add KEGG gene codes to a file containing UNIPROT codes

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

144

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

145 add KEGG compound codes to a file containing chebi codes

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

146

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

147 etc

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

148

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

149 As an example for transcripts and proteins, users can check http://www.uniprot.org/taxonomy/ to

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

150 see if their organism has been mapped to GO terms by Uniprot. For example the link

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

151 http://www.uniprot.org/uniprot/?query=taxonomy:2850 will show the Uniprot repository and cross-references

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

152 for the taxonomy 2850.

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

153 When the organism being studied is not available, then other strategies

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

154 could be tried (like Blast2GO for example).

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

155

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

156 Despite the specific examples above, this class is generic and can be used to map any

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

157 values to new terms according to a given lookup table.

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

158

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

159 .. class:: infomark

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

160

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

161 *Omics cross-reference resources on the web:*

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

162

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

163 LinkDB: http://www.genome.jp/linkdb/

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

164

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

165 *Ready to use metabolomics links:*

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

166

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

167 http://rest.genome.jp/link/compound/chebi

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

168

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

169 http://rest.genome.jp/link/compound/lipidmaps

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

170

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

171 http://rest.genome.jp/link/compound/lipidbank

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

172

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

173 http://rest.genome.jp/link/compound/hmdb

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

174

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

175

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

176 *Ready to use proteomics links:*

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

177

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

178 http://rest.genome.jp/link/uniprot/pti (Phaeodactylum Tri.)

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

179

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

180 http://rest.genome.jp/link/uniprot/hsa (Homo Sapiens)

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

181

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

182 (for organism code list see: )

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

183

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

184

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

185 Uniprot to GO

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

186

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

187 http://www.uniprot.org/taxonomy/

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

188

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

189

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

190 -----

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

191

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

192 **Output**

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

193

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

194 This method will read in the given input file and for each line it will add a new column

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

195 containing the terms found for the ID in that line. So the output file is the same as the

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

196 input file + extra terms column (separated by ; ).

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

197

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

198 -----

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

199

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

200 **Link to ontology viewer**

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

201

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

202 A second summarized "terms observations" file can also be generated.

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

203 In case the terms are ontology terms, this file can be used for visualizing the results

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

204 in the ontology viewer "OntologyAndObservationsViewer".

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

205

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

206 </help>

ce9228263148 renamed to TermMapper

pieter.lukasse@wur.nl

parents:

diff changeset

207 </tool>

Mercurial > repos > pieterlukasse > primo_multiomics

annotate term_mapper.xml @ 7:ce9228263148