maaslin: src/lib/SummarizeMaaslin.R annotate

annotate src/lib/SummarizeMaaslin.R @ 0:e0b5980139d9

maaslin

author	george-weingart
date	Tue, 13 May 2014 22:00:40 -0400
parents
children

rev	line source
0 e0b5980139d9 maaslin george-weingart parents: diff changeset	1 #####################################################################################
e0b5980139d9 maaslin george-weingart parents: diff changeset	2 #Copyright (C) <2012>
e0b5980139d9 maaslin george-weingart parents: diff changeset	3 #
e0b5980139d9 maaslin george-weingart parents: diff changeset	4 #Permission is hereby granted, free of charge, to any person obtaining a copy of
e0b5980139d9 maaslin george-weingart parents: diff changeset	5 #this software and associated documentation files (the "Software"), to deal in the
e0b5980139d9 maaslin george-weingart parents: diff changeset	6 #Software without restriction, including without limitation the rights to use, copy,
e0b5980139d9 maaslin george-weingart parents: diff changeset	7 #modify, merge, publish, distribute, sublicense, and/or sell copies of the Software,
e0b5980139d9 maaslin george-weingart parents: diff changeset	8 #and to permit persons to whom the Software is furnished to do so, subject to
e0b5980139d9 maaslin george-weingart parents: diff changeset	9 #the following conditions:
e0b5980139d9 maaslin george-weingart parents: diff changeset	10 #
e0b5980139d9 maaslin george-weingart parents: diff changeset	11 #The above copyright notice and this permission notice shall be included in all copies
e0b5980139d9 maaslin george-weingart parents: diff changeset	12 #or substantial portions of the Software.
e0b5980139d9 maaslin george-weingart parents: diff changeset	13 #
e0b5980139d9 maaslin george-weingart parents: diff changeset	14 #THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR IMPLIED,
e0b5980139d9 maaslin george-weingart parents: diff changeset	15 #INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY, FITNESS FOR A
e0b5980139d9 maaslin george-weingart parents: diff changeset	16 #PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE AUTHORS OR COPYRIGHT
e0b5980139d9 maaslin george-weingart parents: diff changeset	17 #HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER LIABILITY, WHETHER IN AN ACTION
e0b5980139d9 maaslin george-weingart parents: diff changeset	18 #OF CONTRACT, TORT OR OTHERWISE, ARISING FROM, OUT OF OR IN CONNECTION WITH THE
e0b5980139d9 maaslin george-weingart parents: diff changeset	19 #SOFTWARE OR THE USE OR OTHER DEALINGS IN THE SOFTWARE.
e0b5980139d9 maaslin george-weingart parents: diff changeset	20 #
e0b5980139d9 maaslin george-weingart parents: diff changeset	21 # This file is a component of the MaAsLin (Multivariate Associations Using Linear Models),
e0b5980139d9 maaslin george-weingart parents: diff changeset	22 # authored by the Huttenhower lab at the Harvard School of Public Health
e0b5980139d9 maaslin george-weingart parents: diff changeset	23 # (contact Timothy Tickle, ttickle@hsph.harvard.edu).
e0b5980139d9 maaslin george-weingart parents: diff changeset	24 #####################################################################################
e0b5980139d9 maaslin george-weingart parents: diff changeset	25
e0b5980139d9 maaslin george-weingart parents: diff changeset	26 inlinedocs <- function(
e0b5980139d9 maaslin george-weingart parents: diff changeset	27 ##author<< Curtis Huttenhower <chuttenh@hsph.harvard.edu> and Timothy Tickle <ttickle@hsph.harvard.edu>
e0b5980139d9 maaslin george-weingart parents: diff changeset	28 ##description<< Creates a summary of association detail files.
e0b5980139d9 maaslin george-weingart parents: diff changeset	29 ) { return( pArgs ) }
e0b5980139d9 maaslin george-weingart parents: diff changeset	30
e0b5980139d9 maaslin george-weingart parents: diff changeset	31 #Logging class
e0b5980139d9 maaslin george-weingart parents: diff changeset	32 suppressMessages(library(logging, warn.conflicts=FALSE, quietly=TRUE, verbose=FALSE))
e0b5980139d9 maaslin george-weingart parents: diff changeset	33
e0b5980139d9 maaslin george-weingart parents: diff changeset	34 # Get logger
e0b5980139d9 maaslin george-weingart parents: diff changeset	35 c_logrMaaslin <- getLogger( "maaslin" )
e0b5980139d9 maaslin george-weingart parents: diff changeset	36
e0b5980139d9 maaslin george-weingart parents: diff changeset	37 funcSummarizeDirectory = function(
e0b5980139d9 maaslin george-weingart parents: diff changeset	38 ### Summarizes the massline detail files into one file based on significance.
e0b5980139d9 maaslin george-weingart parents: diff changeset	39 astrOutputDirectory,
e0b5980139d9 maaslin george-weingart parents: diff changeset	40 ### The output directory to find the MaAsLin results.
e0b5980139d9 maaslin george-weingart parents: diff changeset	41 strBaseName,
e0b5980139d9 maaslin george-weingart parents: diff changeset	42 ### The prefix string used in maaslin to start the detail files.
e0b5980139d9 maaslin george-weingart parents: diff changeset	43 astrSummaryFileName,
e0b5980139d9 maaslin george-weingart parents: diff changeset	44 ### The summary file's name, should be a path not a file name
e0b5980139d9 maaslin george-weingart parents: diff changeset	45 astrKeyword,
e0b5980139d9 maaslin george-weingart parents: diff changeset	46 ### The column name of the data to check significance before adding a detail to the summary
e0b5980139d9 maaslin george-weingart parents: diff changeset	47 afSignificanceLevel
e0b5980139d9 maaslin george-weingart parents: diff changeset	48 ### The value of significance the data must be at or below to be included in the summary (0.0 is most significant; like p-values)
e0b5980139d9 maaslin george-weingart parents: diff changeset	49 ){
e0b5980139d9 maaslin george-weingart parents: diff changeset	50 #Store significant data elements
e0b5980139d9 maaslin george-weingart parents: diff changeset	51 dfSignificantData = NULL
e0b5980139d9 maaslin george-weingart parents: diff changeset	52
e0b5980139d9 maaslin george-weingart parents: diff changeset	53 #Get detail files in output directory
e0b5980139d9 maaslin george-weingart parents: diff changeset	54 astrlsDetailFiles = list.files(astrOutputDirectory, pattern=paste(strBaseName,"-","[[:print:]]*",c_sDetailFileSuffix,sep=""), full.names=TRUE)
e0b5980139d9 maaslin george-weingart parents: diff changeset	55 logdebug(format(astrlsDetailFiles),c_logrMaaslin)
e0b5980139d9 maaslin george-weingart parents: diff changeset	56
e0b5980139d9 maaslin george-weingart parents: diff changeset	57 #For each file after the first file
e0b5980139d9 maaslin george-weingart parents: diff changeset	58 for(astrFile in astrlsDetailFiles)
e0b5980139d9 maaslin george-weingart parents: diff changeset	59 {
e0b5980139d9 maaslin george-weingart parents: diff changeset	60 #Read in data and reduce to significance
e0b5980139d9 maaslin george-weingart parents: diff changeset	61 dfDetails = read.table(astrFile, header=TRUE, sep=c_cTableDelimiter)
e0b5980139d9 maaslin george-weingart parents: diff changeset	62 dfDetails = dfDetails[which(dfDetails[astrKeyword] <= afSignificanceLevel),]
e0b5980139d9 maaslin george-weingart parents: diff changeset	63
e0b5980139d9 maaslin george-weingart parents: diff changeset	64 #Combine with other data if it exists
e0b5980139d9 maaslin george-weingart parents: diff changeset	65 if(is.null(dfSignificantData))
e0b5980139d9 maaslin george-weingart parents: diff changeset	66 {
e0b5980139d9 maaslin george-weingart parents: diff changeset	67 dfSignificantData = dfDetails
e0b5980139d9 maaslin george-weingart parents: diff changeset	68 } else {
e0b5980139d9 maaslin george-weingart parents: diff changeset	69 dfSignificantData = rbind(dfSignificantData,dfDetails)
e0b5980139d9 maaslin george-weingart parents: diff changeset	70 }
e0b5980139d9 maaslin george-weingart parents: diff changeset	71 }
e0b5980139d9 maaslin george-weingart parents: diff changeset	72
e0b5980139d9 maaslin george-weingart parents: diff changeset	73 #Write data to file
e0b5980139d9 maaslin george-weingart parents: diff changeset	74 unlink(astrSummaryFileName)
e0b5980139d9 maaslin george-weingart parents: diff changeset	75 if(is.null(dfSignificantData))
e0b5980139d9 maaslin george-weingart parents: diff changeset	76 {
e0b5980139d9 maaslin george-weingart parents: diff changeset	77 funcWrite("No significant data found.",astrSummaryFileName)
e0b5980139d9 maaslin george-weingart parents: diff changeset	78 return( NULL )
e0b5980139d9 maaslin george-weingart parents: diff changeset	79 } else {
e0b5980139d9 maaslin george-weingart parents: diff changeset	80 #Sort by metadata and then significance
e0b5980139d9 maaslin george-weingart parents: diff changeset	81 dfSignificantData = dfSignificantData[order(dfSignificantData$Value, dfSignificantData$P.value, decreasing = FALSE),]
e0b5980139d9 maaslin george-weingart parents: diff changeset	82 funcWriteTable( dfSignificantData, astrSummaryFileName, fAppend = FALSE )
e0b5980139d9 maaslin george-weingart parents: diff changeset	83 # Sort by q.value and return
e0b5980139d9 maaslin george-weingart parents: diff changeset	84 return( dfSignificantData[ order( dfSignificantData$P.value, decreasing = FALSE ), ] )
e0b5980139d9 maaslin george-weingart parents: diff changeset	85 }
e0b5980139d9 maaslin george-weingart parents: diff changeset	86 }

Mercurial > repos > george-weingart > maaslin

annotate src/lib/SummarizeMaaslin.R @ 0:e0b5980139d9