lastz_paired_reads: lastz_paired_reads

author	devteam
date	Mon, 26 Nov 2012 09:48:27 -0500
parents
children	39f974d0884e

rev	line source
0 96825cee5c25 Uploaded tarball devteam parents: diff changeset	1 <tool id="lastz_paired_reads_wrapper" name="Lastz paired reads" version="1.1.1">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	2 <requirements>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	3 <requirement type="package" version="1.02.00">lastz</requirement>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	4 </requirements>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	5 <description> map short paired reads against reference sequence</description>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	6 <command interpreter="python">lastz_paired_reads_wrapper.py
96825cee5c25 Uploaded tarball devteam parents: diff changeset	7 #if $seq_name.how_to_name=="yes":
96825cee5c25 Uploaded tarball devteam parents: diff changeset	8 --ref_name=$seq_name.ref_name
96825cee5c25 Uploaded tarball devteam parents: diff changeset	9 #end if
96825cee5c25 Uploaded tarball devteam parents: diff changeset	10 --ref_source=$source.ref_source
96825cee5c25 Uploaded tarball devteam parents: diff changeset	11 --input2=$input2
96825cee5c25 Uploaded tarball devteam parents: diff changeset	12 --input3=$input3
96825cee5c25 Uploaded tarball devteam parents: diff changeset	13 --input4=$input4
96825cee5c25 Uploaded tarball devteam parents: diff changeset	14 #if $source.ref_source=="history":
96825cee5c25 Uploaded tarball devteam parents: diff changeset	15 --input1=$source.input1
96825cee5c25 Uploaded tarball devteam parents: diff changeset	16 --ref_sequences=$input1.metadata.sequences
96825cee5c25 Uploaded tarball devteam parents: diff changeset	17 #else:
96825cee5c25 Uploaded tarball devteam parents: diff changeset	18 --input1="${source.input1_2bit.fields.path}"
96825cee5c25 Uploaded tarball devteam parents: diff changeset	19 #end if
96825cee5c25 Uploaded tarball devteam parents: diff changeset	20 --output=$output1
96825cee5c25 Uploaded tarball devteam parents: diff changeset	21 --lastz_seqs_file_dir=${GALAXY_DATA_INDEX_DIR}
96825cee5c25 Uploaded tarball devteam parents: diff changeset	22 </command>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	23 <inputs>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	24 <param name="input2" format="fasta" type="data" label="Align sequencing reads in" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	25 <conditional name="source">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	26 <param name="ref_source" type="select" label="Against reference sequences that are">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	27 <option value="cached">locally cached</option>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	28 <option value="history">in your history</option>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	29 </param>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	30 <when value="cached">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	31 <param name="input1_2bit" type="select" label="Using reference genome" help="If your genome of interest is not listed, contact the Galaxy team">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	32 <options from_data_table="lastz_seqs" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	33 </param>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	34 </when>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	35 <when value="history">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	36 <param name="input1" type="data" format="fasta" label="Select a reference dataset" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	37 </when>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	38 </conditional>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	39 <param name="input3" format="fasta" type="data" label="Linker file" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	40 <param name="input4" format="qual454" type="data" label="Select a base quality score 454 dataset" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	41 <conditional name="seq_name">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	42 <param name="how_to_name" type="select" label="Do you want to modify the reference name?">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	43 <option value="no">No</option>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	44 <option value="yes">Yes</option>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	45 </param>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	46 <when value="yes">
96825cee5c25 Uploaded tarball devteam parents: diff changeset	47 <param name="ref_name" type="text" size="25" value="Type sequence name here" label="Enter name for the Reference sequence"/>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	48 </when>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	49 <when value="no" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	50 </conditional>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	51 </inputs>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	52 <outputs>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	53 <data format="sam" name="output1" label="${tool.name} on ${on_string}: mapped reads" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	54 </outputs>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	55 <tests>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	56 <test>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	57 <!--
96825cee5c25 Uploaded tarball devteam parents: diff changeset	58 input1: a reference genome ( 2bit or fasta )
96825cee5c25 Uploaded tarball devteam parents: diff changeset	59 input2: a collection of 454 paired end reads ( a fasta file )
96825cee5c25 Uploaded tarball devteam parents: diff changeset	60 input3: a linker sequence ( a very small fasta file )
96825cee5c25 Uploaded tarball devteam parents: diff changeset	61 input4: a base quality score 454 file ( qual454 )
96825cee5c25 Uploaded tarball devteam parents: diff changeset	62 -->
96825cee5c25 Uploaded tarball devteam parents: diff changeset	63 <param name="input2" value="lastz_paired_input2.fasta" ftype="fasta" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	64 <param name="ref_source" value="cached" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	65 <param name="input1_2bit" value="/galaxy/data/hg18/seq/chr21.2bit" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	66 <param name="input3" value="lastz_paired_input3.fasta" ftype="fasta" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	67 <param name="input4" value="lastz_paired_input4.qual454" ftype="qual454" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	68 <param name="how_to_name" value="no" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	69 <output name="output1" file="lastz_paired_out1.sam" />
96825cee5c25 Uploaded tarball devteam parents: diff changeset	70 </test>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	71 </tests>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	72 <help>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	73
96825cee5c25 Uploaded tarball devteam parents: diff changeset	74 What it does
96825cee5c25 Uploaded tarball devteam parents: diff changeset	75
96825cee5c25 Uploaded tarball devteam parents: diff changeset	76 LASTZ is a high performance pairwise sequence aligner derived from BLASTZ. It is written by Bob Harris in Webb Miller's laboratory at Penn State University. Special scoring sets were derived to improve runtime performance and quality. This Galaxy version of LASTZ is geared towards aligning short (Illumina/Solexa, AB/SOLiD) and medium (Roche/454) paired reads against a reference sequence. There is excellent, extensive documentation on LASTZ available here_.
96825cee5c25 Uploaded tarball devteam parents: diff changeset	77
96825cee5c25 Uploaded tarball devteam parents: diff changeset	78 .. _here: http://www.bx.psu.edu/miller_lab/dist/README.lastz-1.02.00/README.lastz-1.02.00.html
96825cee5c25 Uploaded tarball devteam parents: diff changeset	79
96825cee5c25 Uploaded tarball devteam parents: diff changeset	80 ------
96825cee5c25 Uploaded tarball devteam parents: diff changeset	81
96825cee5c25 Uploaded tarball devteam parents: diff changeset	82 Input formats
96825cee5c25 Uploaded tarball devteam parents: diff changeset	83
96825cee5c25 Uploaded tarball devteam parents: diff changeset	84 LASTZ accepts reference and reads in FASTA format. However, because Galaxy supports implicit format conversion the tool will recognize fastq and other method specific formats.
96825cee5c25 Uploaded tarball devteam parents: diff changeset	85
96825cee5c25 Uploaded tarball devteam parents: diff changeset	86 ------
96825cee5c25 Uploaded tarball devteam parents: diff changeset	87
96825cee5c25 Uploaded tarball devteam parents: diff changeset	88 Outputs
96825cee5c25 Uploaded tarball devteam parents: diff changeset	89
96825cee5c25 Uploaded tarball devteam parents: diff changeset	90 This LASTZ tool produces a SAM file showing sequence alignments.
96825cee5c25 Uploaded tarball devteam parents: diff changeset	91
96825cee5c25 Uploaded tarball devteam parents: diff changeset	92 SAM output
96825cee5c25 Uploaded tarball devteam parents: diff changeset	93
96825cee5c25 Uploaded tarball devteam parents: diff changeset	94 SAM has 12 columns::
96825cee5c25 Uploaded tarball devteam parents: diff changeset	95
96825cee5c25 Uploaded tarball devteam parents: diff changeset	96 1 2 3 4 5 6 7 8 9 10 11 12
96825cee5c25 Uploaded tarball devteam parents: diff changeset	97 ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
96825cee5c25 Uploaded tarball devteam parents: diff changeset	98 HWI-EAS91_1_30788AAXX:1:2:1670:915 99 chr9 58119878 60 36M = 58120234 392 GACCCCTACCCCACCGTGCTCTGGATCTCAGTGTTT IIIIIIIIIIIIIIIIEIIIIIII7IIIIIIIIIII XT:A:U NM:i:0 SM:i:37 AM:i:37 X0:i:1 X1:i:0 XM:i:0 XO:i:0 XG:i:0 MD:Z:36
96825cee5c25 Uploaded tarball devteam parents: diff changeset	99 HWI-EAS91_1_30788AAXX:1:2:1670:915 147 chr9 58120234 60 36M = 58119878 -392 ATGAGTCGAATTCTATTTTCCAAACTGTTAACAAAA IFIIDI;IIICIIIIIIIIIIIIIIIIIIIIIIIII XT:A:U NM:i:0 SM:i:37 AM:i:37 X0:i:1 X1:i:0 XM:i:0 XO:i:0 XG:i:0 MD:Z:36
96825cee5c25 Uploaded tarball devteam parents: diff changeset	100
96825cee5c25 Uploaded tarball devteam parents: diff changeset	101
96825cee5c25 Uploaded tarball devteam parents: diff changeset	102 where::
96825cee5c25 Uploaded tarball devteam parents: diff changeset	103
96825cee5c25 Uploaded tarball devteam parents: diff changeset	104 Column Description
96825cee5c25 Uploaded tarball devteam parents: diff changeset	105 --------- ---------------------------------------------------------------------
96825cee5c25 Uploaded tarball devteam parents: diff changeset	106 1. QNAME Query (pair) NAME
96825cee5c25 Uploaded tarball devteam parents: diff changeset	107 2. FLAG bitwise FLAG
96825cee5c25 Uploaded tarball devteam parents: diff changeset	108 3. RNAME Reference sequence NAME
96825cee5c25 Uploaded tarball devteam parents: diff changeset	109 4. POS 1-based leftmost POSition/coordinate of clipped sequence
96825cee5c25 Uploaded tarball devteam parents: diff changeset	110 5. MAPQ MAPping Quality (Phred-scaled)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	111 6. CIGAR extended CIGAR string
96825cee5c25 Uploaded tarball devteam parents: diff changeset	112 7. MRNM Mate Reference sequence NaMe ('=' if same as RNAME)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	113 8. MPOS 1-based Mate POSition
96825cee5c25 Uploaded tarball devteam parents: diff changeset	114 9. ISIZE Inferred insert SIZE
96825cee5c25 Uploaded tarball devteam parents: diff changeset	115 10. SEQ query SEQuence on the same strand as the reference
96825cee5c25 Uploaded tarball devteam parents: diff changeset	116 11. QUAL query QUALity (ASCII-33 gives the Phred base quality)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	117 12. OPT variable OPTional fields in the format TAG:VTYPE:VALUE, tab-separated
96825cee5c25 Uploaded tarball devteam parents: diff changeset	118
96825cee5c25 Uploaded tarball devteam parents: diff changeset	119 The flags are as follows::
96825cee5c25 Uploaded tarball devteam parents: diff changeset	120
96825cee5c25 Uploaded tarball devteam parents: diff changeset	121 Flag Description
96825cee5c25 Uploaded tarball devteam parents: diff changeset	122 ------ -------------------------------------
96825cee5c25 Uploaded tarball devteam parents: diff changeset	123 0x0001 the read is paired in sequencing
96825cee5c25 Uploaded tarball devteam parents: diff changeset	124 0x0002 the read is mapped in a proper pair
96825cee5c25 Uploaded tarball devteam parents: diff changeset	125 0x0004 the query sequence itself is unmapped
96825cee5c25 Uploaded tarball devteam parents: diff changeset	126 0x0008 the mate is unmapped
96825cee5c25 Uploaded tarball devteam parents: diff changeset	127 0x0010 strand of the query (1 for reverse)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	128 0x0020 strand of the mate
96825cee5c25 Uploaded tarball devteam parents: diff changeset	129 0x0040 the read is the first read in a pair
96825cee5c25 Uploaded tarball devteam parents: diff changeset	130 0x0080 the read is the second read in a pair
96825cee5c25 Uploaded tarball devteam parents: diff changeset	131 0x0100 the alignment is not primary
96825cee5c25 Uploaded tarball devteam parents: diff changeset	132
96825cee5c25 Uploaded tarball devteam parents: diff changeset	133 ------
96825cee5c25 Uploaded tarball devteam parents: diff changeset	134
96825cee5c25 Uploaded tarball devteam parents: diff changeset	135 Do you want to modify the reference name?
96825cee5c25 Uploaded tarball devteam parents: diff changeset	136
96825cee5c25 Uploaded tarball devteam parents: diff changeset	137 This option allows you to set the name of the reference sequence manually. This is helpful when, for example, you would like to make the reference name compatible with the UCSC naming conventions to be able to display your lastz results as a custom track at the UCSC Genome Browser.
96825cee5c25 Uploaded tarball devteam parents: diff changeset	138
96825cee5c25 Uploaded tarball devteam parents: diff changeset	139 ------
96825cee5c25 Uploaded tarball devteam parents: diff changeset	140
96825cee5c25 Uploaded tarball devteam parents: diff changeset	141 LASTZ parameter list
96825cee5c25 Uploaded tarball devteam parents: diff changeset	142
96825cee5c25 Uploaded tarball devteam parents: diff changeset	143 This is an exhaustive list of LASTZ options. Once again, please note that not all parameters are included in this interface. If you would like to make additional options available through Galaxy, e-mail us at galaxy-bugs@bx.psu.edu::
96825cee5c25 Uploaded tarball devteam parents: diff changeset	144
96825cee5c25 Uploaded tarball devteam parents: diff changeset	145 target[[s..e]][-] spec/file containing target sequence (fasta or nib)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	146 [s..e] defines a subrange of the file
96825cee5c25 Uploaded tarball devteam parents: diff changeset	147 - indicates reverse-complement
96825cee5c25 Uploaded tarball devteam parents: diff changeset	148 (use --help=files for more details)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	149 query[[s..e]][-] spec/file containing query sequences (fasta or nib)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	150 if absent, queries come from stdin (unless they
96825cee5c25 Uploaded tarball devteam parents: diff changeset	151 aren't needed, as for --self or --tableonly)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	152 (use --help=files for more details)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	153 --self the target sequence is also the query
96825cee5c25 Uploaded tarball devteam parents: diff changeset	154 --quantum the query sequence contains quantum DNA
96825cee5c25 Uploaded tarball devteam parents: diff changeset	155 --seed=match<length> use a word with no gaps instead of a seed pattern
96825cee5c25 Uploaded tarball devteam parents: diff changeset	156 --seed=half<length> use space-free half-weight word instead of seed pattern
96825cee5c25 Uploaded tarball devteam parents: diff changeset	157 --match=<reward>[,<penalty>] set the score values for a match (+<reward>)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	158 and mismatch (-<penalty>)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	159 --[no]trans[ition][=2] allow one or two transitions in a seed hit
96825cee5c25 Uploaded tarball devteam parents: diff changeset	160 (by default a transition is allowed)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	161 --word=<bits> set max bits for word hash; use this to trade time for
96825cee5c25 Uploaded tarball devteam parents: diff changeset	162 memory, eliminating thrashing for heavy seeds
96825cee5c25 Uploaded tarball devteam parents: diff changeset	163 (default is 28 bits)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	164 --[no]filter=[<T>:]<M> filter half-weight seed hits, requiring at least M
96825cee5c25 Uploaded tarball devteam parents: diff changeset	165 matches and allowing no more than T transversions
96825cee5c25 Uploaded tarball devteam parents: diff changeset	166 (default is no filtering)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	167 --notwins require just one seed hit
96825cee5c25 Uploaded tarball devteam parents: diff changeset	168 --twins=[<min>:]<maxgap> require two nearby seed hits on the same diagonal
96825cee5c25 Uploaded tarball devteam parents: diff changeset	169 (default is twins aren't required)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	170 --notwins allow single, isolated seeds
96825cee5c25 Uploaded tarball devteam parents: diff changeset	171 --[no]recoverseeds avoid losing seeds in hash collisions. Cannot be used with --twins
96825cee5c25 Uploaded tarball devteam parents: diff changeset	172 --seedqueue=<entries> set number of entries in seed hit queue
96825cee5c25 Uploaded tarball devteam parents: diff changeset	173 (default is 262144)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	174 --anchors=<file> read anchors from a file, instead of discovering anchors
96825cee5c25 Uploaded tarball devteam parents: diff changeset	175 via seeding
96825cee5c25 Uploaded tarball devteam parents: diff changeset	176 --recoverhits recover hash-collision seed hits
96825cee5c25 Uploaded tarball devteam parents: diff changeset	177 (default is not to recover seed hits)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	178 --step=<length> set step length (default is 1)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	179 --maxwordcount=<limit> words occurring more often than <limit> in the target
96825cee5c25 Uploaded tarball devteam parents: diff changeset	180 are not eligible for seeds
96825cee5c25 Uploaded tarball devteam parents: diff changeset	181 --strand=both search both strands
96825cee5c25 Uploaded tarball devteam parents: diff changeset	182 --strand=plus search + strand only (matching strand of query spec)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	183 --strand=minus search - strand only (opposite strand of query spec)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	184 (by default both strands are searched)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	185 --ambiguousn treat N as an ambiguous nucleotide
96825cee5c25 Uploaded tarball devteam parents: diff changeset	186 (by default N is treated as a sequence splicing character)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	187 --[no]gfextend perform gap-free extension of seed hits to HSPs
96825cee5c25 Uploaded tarball devteam parents: diff changeset	188 (by default no extension is performed)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	189 --[no]chain perform chaining
96825cee5c25 Uploaded tarball devteam parents: diff changeset	190 --chain=<diag,anti> perform chaining with given penalties for diagonal and
96825cee5c25 Uploaded tarball devteam parents: diff changeset	191 anti-diagonal
96825cee5c25 Uploaded tarball devteam parents: diff changeset	192 (by default no chaining is performed)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	193 --[no]gapped perform gapped alignment (instead of gap-free)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	194 (by default gapped alignment is performed)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	195 --score[s]=<file> read substitution scores from a file
96825cee5c25 Uploaded tarball devteam parents: diff changeset	196 (default is HOXD70)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	197 --unitscore[s] scores are +1/-1 for match/mismatch
96825cee5c25 Uploaded tarball devteam parents: diff changeset	198 --gap=<[open,]extend> set gap open and extend penalties (default is 400,30)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	199 --xdrop=<score> set x-drop threshold (default is 10*sub[A][A])
96825cee5c25 Uploaded tarball devteam parents: diff changeset	200 --ydrop=<score> set y-drop threshold (default is open+300extend)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	201 --infer[=<control>] infer scores from the sequences, then use them
96825cee5c25 Uploaded tarball devteam parents: diff changeset	202 --inferonly[=<control>] infer scores, but don't use them (requires --infscores)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	203 all inference options are read from the control file
96825cee5c25 Uploaded tarball devteam parents: diff changeset	204 --infscores[=<file>] write inferred scores to a file
96825cee5c25 Uploaded tarball devteam parents: diff changeset	205 --hspthresh=<score> set threshold for high scoring pairs (default is 3000)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	206 ungapped extensions scoring lower are discarded
96825cee5c25 Uploaded tarball devteam parents: diff changeset	207 <score> can also be a percentage or base count
96825cee5c25 Uploaded tarball devteam parents: diff changeset	208 --entropy adjust for entropy when qualifying HSPs in the x-drop extension
96825cee5c25 Uploaded tarball devteam parents: diff changeset	209 method
96825cee5c25 Uploaded tarball devteam parents: diff changeset	210 --noentropy don't adjust for entropy when qualifying HSPs
96825cee5c25 Uploaded tarball devteam parents: diff changeset	211 --exact=<length> set threshold for exact matches
96825cee5c25 Uploaded tarball devteam parents: diff changeset	212 if specified, exact matches are found rather than high
96825cee5c25 Uploaded tarball devteam parents: diff changeset	213 scoring pairs (replaces --hspthresh)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	214 --inner=<score> set threshold for HSPs during interpolation
96825cee5c25 Uploaded tarball devteam parents: diff changeset	215 (default is no interpolation)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	216 --gappedthresh=<score> set threshold for gapped alignments
96825cee5c25 Uploaded tarball devteam parents: diff changeset	217 gapped extensions scoring lower are discarded
96825cee5c25 Uploaded tarball devteam parents: diff changeset	218 <score> can also be a percentage or base count
96825cee5c25 Uploaded tarball devteam parents: diff changeset	219 (default is to use same value as --hspthresh)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	220 --ball=<score> set minimum score required of words 'in' a quantum ball
96825cee5c25 Uploaded tarball devteam parents: diff changeset	221 --[no]entropy involve entropy in filtering high scoring pairs
96825cee5c25 Uploaded tarball devteam parents: diff changeset	222 (default is "entropy")
96825cee5c25 Uploaded tarball devteam parents: diff changeset	223 --[no]mirror report/use mirror image of all gap-free alignments
96825cee5c25 Uploaded tarball devteam parents: diff changeset	224 (default is "mirror" for self-alignments only)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	225 --traceback=<bytes> space for trace-back information
96825cee5c25 Uploaded tarball devteam parents: diff changeset	226 (default is 80.0M)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	227 --masking=<count> mask any position in target hit this many times
96825cee5c25 Uploaded tarball devteam parents: diff changeset	228 zero indicates no masking
96825cee5c25 Uploaded tarball devteam parents: diff changeset	229 (default is no masking)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	230 --targetcapsule=<capsule_file> the target seed word position table and seed
96825cee5c25 Uploaded tarball devteam parents: diff changeset	231 (as well as the target sequence)are read from specified file
96825cee5c25 Uploaded tarball devteam parents: diff changeset	232 --segments=<segment_file> read segments from a file, instead of discovering
96825cee5c25 Uploaded tarball devteam parents: diff changeset	233 them via seeding. Replaces other seeding or gap-free extension
96825cee5c25 Uploaded tarball devteam parents: diff changeset	234 options
96825cee5c25 Uploaded tarball devteam parents: diff changeset	235 --[no]census[=<file>] count/report how many times each target base aligns
96825cee5c25 Uploaded tarball devteam parents: diff changeset	236 (default is to not report census)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	237 --identity=<min>[..<max>] filter alignments by percent identity
96825cee5c25 Uploaded tarball devteam parents: diff changeset	238 0<=min<=max<=100; blocks (or HSPs) outside min..max
96825cee5c25 Uploaded tarball devteam parents: diff changeset	239 are discarded
96825cee5c25 Uploaded tarball devteam parents: diff changeset	240 (default is no identity filtering)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	241 --coverage=<min>[..<max>] filter alignments by percentage pf query covered
96825cee5c25 Uploaded tarball devteam parents: diff changeset	242 0<=min<=max<=100; blocks (or HSPs) outside min..max
96825cee5c25 Uploaded tarball devteam parents: diff changeset	243 are discarded
96825cee5c25 Uploaded tarball devteam parents: diff changeset	244 (default is no query coverage filtering)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	245 --notrivial do not output trivial self-alignment block if the target and query
96825cee5c25 Uploaded tarball devteam parents: diff changeset	246 sequences are identical. Using --self enables this option automatically
96825cee5c25 Uploaded tarball devteam parents: diff changeset	247 --output=<output_file> write the alignments to the specified file name instead of stdout
96825cee5c25 Uploaded tarball devteam parents: diff changeset	248 --code=<file> give quantum code for query sequence (only for display)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	249 --format=<type> specify output format; one of lav, axt, maf, maf+, maf-, text,
96825cee5c25 Uploaded tarball devteam parents: diff changeset	250 lav+text, cigar, text, rdplot, general, or general:<fields>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	251 (by default output is LAV)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	252 --rdotplot=<file> create an additional output file suitable for plotting the alignments
96825cee5c25 Uploaded tarball devteam parents: diff changeset	253 with the R statistical package.
96825cee5c25 Uploaded tarball devteam parents: diff changeset	254 --markend Just before normal completion, write "# lastz end-of-file" to output file
96825cee5c25 Uploaded tarball devteam parents: diff changeset	255 --census[=<output_file>] count and report how many times each target base aligns, up
96825cee5c25 Uploaded tarball devteam parents: diff changeset	256 to 255. Ns are included in the count
96825cee5c25 Uploaded tarball devteam parents: diff changeset	257 --census16[=<output_file>] count and report how many times each target base aligns, up
96825cee5c25 Uploaded tarball devteam parents: diff changeset	258 up 65 thousand
96825cee5c25 Uploaded tarball devteam parents: diff changeset	259 --census32[=<output_file>] count and report how many times each target bas aligns, up
96825cee5c25 Uploaded tarball devteam parents: diff changeset	260 to 4 billion
96825cee5c25 Uploaded tarball devteam parents: diff changeset	261 --writecapsule=<capsule_file> just write out a targegt capsule file and quit; don't
96825cee5c25 Uploaded tarball devteam parents: diff changeset	262 search for seeds or perform subsequent stages
96825cee5c25 Uploaded tarball devteam parents: diff changeset	263 --verbosity=<level> set info level (0 is minimum, 10 is everything)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	264 (default is 0)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	265 --[no]runtime report runtime in the output file
96825cee5c25 Uploaded tarball devteam parents: diff changeset	266 (default is to not report runtime)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	267 --tableonly[=count] just produce the target position table, don't
96825cee5c25 Uploaded tarball devteam parents: diff changeset	268 search for seeds
96825cee5c25 Uploaded tarball devteam parents: diff changeset	269 --[no]stats[=<file>] show search statistics (or don't)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	270 (not available in this build)
96825cee5c25 Uploaded tarball devteam parents: diff changeset	271 --version report the program version and quit
96825cee5c25 Uploaded tarball devteam parents: diff changeset	272 --help list all options
96825cee5c25 Uploaded tarball devteam parents: diff changeset	273 --help=files list information about file specifiers
96825cee5c25 Uploaded tarball devteam parents: diff changeset	274 --help=short[cuts] list blastz-compatible shortcuts
96825cee5c25 Uploaded tarball devteam parents: diff changeset	275 --help=yasra list yasra-specific shortcuts
96825cee5c25 Uploaded tarball devteam parents: diff changeset	276
96825cee5c25 Uploaded tarball devteam parents: diff changeset	277 </help>
96825cee5c25 Uploaded tarball devteam parents: diff changeset	278 </tool>

0

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

1 <tool id="lastz_paired_reads_wrapper" name="Lastz paired reads" version="1.1.1">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

2 <requirements>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

3 <requirement type="package" version="1.02.00">lastz</requirement>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

4 </requirements>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

5 <description> map short paired reads against reference sequence</description>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

6 <command interpreter="python">lastz_paired_reads_wrapper.py

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

7 #if $seq_name.how_to_name=="yes":

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

8 --ref_name=$seq_name.ref_name

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

9 #end if

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

10 --ref_source=$source.ref_source

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

11 --input2=$input2

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

12 --input3=$input3

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

13 --input4=$input4

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

14 #if $source.ref_source=="history":

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

15 --input1=$source.input1

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

16 --ref_sequences=$input1.metadata.sequences

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

17 #else:

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

18 --input1="${source.input1_2bit.fields.path}"

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

19 #end if

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

20 --output=$output1

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

21 --lastz_seqs_file_dir=${GALAXY_DATA_INDEX_DIR}

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

22 </command>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

23 <inputs>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

24 <param name="input2" format="fasta" type="data" label="Align sequencing reads in" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

25 <conditional name="source">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

26 <param name="ref_source" type="select" label="Against reference sequences that are">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

27 <option value="cached">locally cached</option>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

28 <option value="history">in your history</option>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

29 </param>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

30 <when value="cached">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

31 <param name="input1_2bit" type="select" label="Using reference genome" help="If your genome of interest is not listed, contact the Galaxy team">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

32 <options from_data_table="lastz_seqs" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

33 </param>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

34 </when>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

35 <when value="history">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

36 <param name="input1" type="data" format="fasta" label="Select a reference dataset" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

37 </when>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

38 </conditional>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

39 <param name="input3" format="fasta" type="data" label="Linker file" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

40 <param name="input4" format="qual454" type="data" label="Select a base quality score 454 dataset" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

41 <conditional name="seq_name">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

42 <param name="how_to_name" type="select" label="Do you want to modify the reference name?">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

43 <option value="no">No</option>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

44 <option value="yes">Yes</option>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

45 </param>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

46 <when value="yes">

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

47 <param name="ref_name" type="text" size="25" value="Type sequence name here" label="Enter name for the Reference sequence"/>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

48 </when>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

49 <when value="no" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

50 </conditional>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

51 </inputs>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

52 <outputs>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

53 <data format="sam" name="output1" label="${tool.name} on ${on_string}: mapped reads" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

54 </outputs>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

55 <tests>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

56 <test>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

57 <!--

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

58 input1: a reference genome ( 2bit or fasta )

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

59 input2: a collection of 454 paired end reads ( a fasta file )

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

60 input3: a linker sequence ( a very small fasta file )

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

61 input4: a base quality score 454 file ( qual454 )

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

62 -->

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

63 <param name="input2" value="lastz_paired_input2.fasta" ftype="fasta" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

64 <param name="ref_source" value="cached" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

65 <param name="input1_2bit" value="/galaxy/data/hg18/seq/chr21.2bit" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

66 <param name="input3" value="lastz_paired_input3.fasta" ftype="fasta" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

67 <param name="input4" value="lastz_paired_input4.qual454" ftype="qual454" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

68 <param name="how_to_name" value="no" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

69 <output name="output1" file="lastz_paired_out1.sam" />

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

70 </test>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

71 </tests>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

72 <help>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

73

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

74 **What it does**

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

75

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

76 **LASTZ** is a high performance pairwise sequence aligner derived from BLASTZ. It is written by Bob Harris in Webb Miller's laboratory at Penn State University. Special scoring sets were derived to improve runtime performance and quality. This Galaxy version of LASTZ is geared towards aligning short (Illumina/Solexa, AB/SOLiD) and medium (Roche/454) paired reads against a reference sequence. There is excellent, extensive documentation on LASTZ available here_.

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

77

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

78 .. _here: http://www.bx.psu.edu/miller_lab/dist/README.lastz-1.02.00/README.lastz-1.02.00.html

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

79

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

80 ------

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

81

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

82 **Input formats**

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

83

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

84 LASTZ accepts reference and reads in FASTA format. However, because Galaxy supports implicit format conversion the tool will recognize fastq and other method specific formats.

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

85

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

86 ------

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

87

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

88 **Outputs**

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

89

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

90 This LASTZ tool produces a SAM file showing sequence alignments.

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

91

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

92 **SAM output**

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

93

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

94 SAM has 12 columns::

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

95

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

96 1 2 3 4 5 6 7 8 9 10 11 12

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

97 ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

98 HWI-EAS91_1_30788AAXX:1:2:1670:915 99 chr9 58119878 60 36M = 58120234 392 GACCCCTACCCCACCGTGCTCTGGATCTCAGTGTTT IIIIIIIIIIIIIIIIEIIIIIII7IIIIIIIIIII XT:A:U NM:i:0 SM:i:37 AM:i:37 X0:i:1 X1:i:0 XM:i:0 XO:i:0 XG:i:0 MD:Z:36

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

99 HWI-EAS91_1_30788AAXX:1:2:1670:915 147 chr9 58120234 60 36M = 58119878 -392 ATGAGTCGAATTCTATTTTCCAAACTGTTAACAAAA IFIIDI;IIICIIIIIIIIIIIIIIIIIIIIIIIII XT:A:U NM:i:0 SM:i:37 AM:i:37 X0:i:1 X1:i:0 XM:i:0 XO:i:0 XG:i:0 MD:Z:36

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

100

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

101

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

102 where::

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

103

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

104 Column Description

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

105 --------- ---------------------------------------------------------------------

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

106 1. QNAME Query (pair) NAME

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

107 2. FLAG bitwise FLAG

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

108 3. RNAME Reference sequence NAME

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

109 4. POS 1-based leftmost POSition/coordinate of clipped sequence

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

110 5. MAPQ MAPping Quality (Phred-scaled)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

111 6. CIGAR extended CIGAR string

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

112 7. MRNM Mate Reference sequence NaMe ('=' if same as RNAME)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

113 8. MPOS 1-based Mate POSition

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

114 9. ISIZE Inferred insert SIZE

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

115 10. SEQ query SEQuence on the same strand as the reference

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

116 11. QUAL query QUALity (ASCII-33 gives the Phred base quality)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

117 12. OPT variable OPTional fields in the format TAG:VTYPE:VALUE, tab-separated

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

118

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

119 The flags are as follows::

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

120

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

121 Flag Description

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

122 ------ -------------------------------------

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

123 0x0001 the read is paired in sequencing

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

124 0x0002 the read is mapped in a proper pair

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

125 0x0004 the query sequence itself is unmapped

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

126 0x0008 the mate is unmapped

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

127 0x0010 strand of the query (1 for reverse)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

128 0x0020 strand of the mate

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

129 0x0040 the read is the first read in a pair

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

130 0x0080 the read is the second read in a pair

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

131 0x0100 the alignment is not primary

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

132

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

133 ------

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

134

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

135 **Do you want to modify the reference name?**

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

136

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

137 This option allows you to set the name of the reference sequence manually. This is helpful when, for example, you would like to make the reference name compatible with the UCSC naming conventions to be able to display your lastz results as a custom track at the UCSC Genome Browser.

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

138

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

139 ------

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

140

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

141 **LASTZ parameter list**

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

142

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

143 This is an exhaustive list of LASTZ options. Once again, please note that not all parameters are included in this interface. If you would like to make additional options available through Galaxy, e-mail us at galaxy-bugs@bx.psu.edu::

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

144

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

145 target[[s..e]][-] spec/file containing target sequence (fasta or nib)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

146 [s..e] defines a subrange of the file

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

147 - indicates reverse-complement

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

148 (use --help=files for more details)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

149 query[[s..e]][-] spec/file containing query sequences (fasta or nib)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

150 if absent, queries come from stdin (unless they

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

151 aren't needed, as for --self or --tableonly)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

152 (use --help=files for more details)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

153 --self the target sequence is also the query

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

154 --quantum the query sequence contains quantum DNA

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

155 --seed=match<length> use a word with no gaps instead of a seed pattern

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

156 --seed=half<length> use space-free half-weight word instead of seed pattern

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

157 --match=<reward>[,<penalty>] set the score values for a match (+<reward>)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

158 and mismatch (-<penalty>)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

159 --[no]trans[ition][=2] allow one or two transitions in a seed hit

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

160 (by default a transition is allowed)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

161 --word=<bits> set max bits for word hash; use this to trade time for

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

162 memory, eliminating thrashing for heavy seeds

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

163 (default is 28 bits)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

164 --[no]filter=[<T>:]<M> filter half-weight seed hits, requiring at least M

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

165 matches and allowing no more than T transversions

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

166 (default is no filtering)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

167 --notwins require just one seed hit

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

168 --twins=[<min>:]<maxgap> require two nearby seed hits on the same diagonal

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

169 (default is twins aren't required)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

170 --notwins allow single, isolated seeds

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

171 --[no]recoverseeds avoid losing seeds in hash collisions. Cannot be used with --twins

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

172 --seedqueue=<entries> set number of entries in seed hit queue

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

173 (default is 262144)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

174 --anchors=<file> read anchors from a file, instead of discovering anchors

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

175 via seeding

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

176 --recoverhits recover hash-collision seed hits

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

177 (default is not to recover seed hits)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

178 --step=<length> set step length (default is 1)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

179 --maxwordcount=<limit> words occurring more often than <limit> in the target

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

180 are not eligible for seeds

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

181 --strand=both search both strands

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

182 --strand=plus search + strand only (matching strand of query spec)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

183 --strand=minus search - strand only (opposite strand of query spec)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

184 (by default both strands are searched)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

185 --ambiguousn treat N as an ambiguous nucleotide

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

186 (by default N is treated as a sequence splicing character)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

187 --[no]gfextend perform gap-free extension of seed hits to HSPs

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

188 (by default no extension is performed)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

189 --[no]chain perform chaining

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

190 --chain=<diag,anti> perform chaining with given penalties for diagonal and

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

191 anti-diagonal

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

192 (by default no chaining is performed)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

193 --[no]gapped perform gapped alignment (instead of gap-free)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

194 (by default gapped alignment is performed)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

195 --score[s]=<file> read substitution scores from a file

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

196 (default is HOXD70)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

197 --unitscore[s] scores are +1/-1 for match/mismatch

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

198 --gap=<[open,]extend> set gap open and extend penalties (default is 400,30)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

199 --xdrop=<score> set x-drop threshold (default is 10*sub[A][A])

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

200 --ydrop=<score> set y-drop threshold (default is open+300extend)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

201 --infer[=<control>] infer scores from the sequences, then use them

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

202 --inferonly[=<control>] infer scores, but don't use them (requires --infscores)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

203 all inference options are read from the control file

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

204 --infscores[=<file>] write inferred scores to a file

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

205 --hspthresh=<score> set threshold for high scoring pairs (default is 3000)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

206 ungapped extensions scoring lower are discarded

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

207 <score> can also be a percentage or base count

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

208 --entropy adjust for entropy when qualifying HSPs in the x-drop extension

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

209 method

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

210 --noentropy don't adjust for entropy when qualifying HSPs

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

211 --exact=<length> set threshold for exact matches

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

212 if specified, exact matches are found rather than high

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

213 scoring pairs (replaces --hspthresh)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

214 --inner=<score> set threshold for HSPs during interpolation

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

215 (default is no interpolation)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

216 --gappedthresh=<score> set threshold for gapped alignments

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

217 gapped extensions scoring lower are discarded

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

218 <score> can also be a percentage or base count

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

219 (default is to use same value as --hspthresh)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

220 --ball=<score> set minimum score required of words 'in' a quantum ball

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

221 --[no]entropy involve entropy in filtering high scoring pairs

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

222 (default is "entropy")

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

223 --[no]mirror report/use mirror image of all gap-free alignments

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

224 (default is "mirror" for self-alignments only)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

225 --traceback=<bytes> space for trace-back information

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

226 (default is 80.0M)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

227 --masking=<count> mask any position in target hit this many times

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

228 zero indicates no masking

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

229 (default is no masking)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

230 --targetcapsule=<capsule_file> the target seed word position table and seed

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

231 (as well as the target sequence)are read from specified file

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

232 --segments=<segment_file> read segments from a file, instead of discovering

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

233 them via seeding. Replaces other seeding or gap-free extension

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

234 options

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

235 --[no]census[=<file>] count/report how many times each target base aligns

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

236 (default is to not report census)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

237 --identity=<min>[..<max>] filter alignments by percent identity

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

238 0<=min<=max<=100; blocks (or HSPs) outside min..max

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

239 are discarded

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

240 (default is no identity filtering)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

241 --coverage=<min>[..<max>] filter alignments by percentage pf query covered

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

242 0<=min<=max<=100; blocks (or HSPs) outside min..max

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

243 are discarded

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

244 (default is no query coverage filtering)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

245 --notrivial do not output trivial self-alignment block if the target and query

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

246 sequences are identical. Using --self enables this option automatically

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

247 --output=<output_file> write the alignments to the specified file name instead of stdout

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

248 --code=<file> give quantum code for query sequence (only for display)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

249 --format=<type> specify output format; one of lav, axt, maf, maf+, maf-, text,

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

250 lav+text, cigar, text, rdplot, general, or general:<fields>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

251 (by default output is LAV)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

252 --rdotplot=<file> create an additional output file suitable for plotting the alignments

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

253 with the R statistical package.

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

254 --markend Just before normal completion, write "# lastz end-of-file" to output file

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

255 --census[=<output_file>] count and report how many times each target base aligns, up

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

256 to 255. Ns are included in the count

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

257 --census16[=<output_file>] count and report how many times each target base aligns, up

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

258 up 65 thousand

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

259 --census32[=<output_file>] count and report how many times each target bas aligns, up

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

260 to 4 billion

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

261 --writecapsule=<capsule_file> just write out a targegt capsule file and quit; don't

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

262 search for seeds or perform subsequent stages

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

263 --verbosity=<level> set info level (0 is minimum, 10 is everything)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

264 (default is 0)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

265 --[no]runtime report runtime in the output file

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

266 (default is to not report runtime)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

267 --tableonly[=count] just produce the target position table, don't

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

268 search for seeds

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

269 --[no]stats[=<file>] show search statistics (or don't)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

270 (not available in this build)

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

271 --version report the program version and quit

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

272 --help list all options

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

273 --help=files list information about file specifiers

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

274 --help=short[cuts] list blastz-compatible shortcuts

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

275 --help=yasra list yasra-specific shortcuts

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

276

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

277 </help>

96825cee5c25 Uploaded tarball

devteam

parents:

diff changeset

278 </tool>

Mercurial > repos > devteam > lastz_paired_reads

annotate lastz_paired_reads_wrapper.xml @ 0:96825cee5c25 draft