pdaug_peptide_ngrams: PDAUG_Peptide_Data_Access/PDAUG_Peptide_Data

"planemo upload for repository https://github.com/jaidevjoshi83/pdaug commit 3c91f421d26c8f42cf2671e47db735d2cf69dde8"

comparison

equal deleted inserted replaced

-:7557b48b2872
+:9b5e990a0ebb
 import os
 import pandas as pd
 def DataGen(DataBaseType, OutFile, IDs):
-if DataBaseType == 'AMPvsTM':
+if DataBaseType == 'AMPvsTMP':
 data = load_AMPvsTM()
 elif DataBaseType == 'AMPvsUniProt':
 data = load_AMPvsUniProt()
-elif DataBaseType == 'ACPvsTM':
+elif DataBaseType == 'ACPvsTMP':
 data = load_ACPvsTM()
 elif DataBaseType == 'ACPvsRandom':
 data = load_ACPvsRandom()
 else:
 print ("Enter Correct Values")
 exit()
-Target = data.target.tolist()
+peptide_data = data.sequences
-Target_list = set(Target)
+class_label = int(len(peptide_data)/2)*[data.target_names[0]]+int(len(peptide_data)/2)*[data.target_names[1]]
-df = data.sequences
+peptide_data = pd.DataFrame(peptide_data, columns=['name'])
+class_label = pd.DataFrame(class_label, columns=['class_label'])
+df = pd.concat([peptide_data,class_label], axis=1)
-Target = pd.DataFrame(Target, columns=['Target'])
-df = pd.DataFrame(df, columns=['Peptide'])
-df = pd.DataFrame(df)
-df = pd.concat([df, Target], axis=1)
 df.to_csv(OutFile, index=False, sep='\t')
 if __name__=="__main__":
 required=False,
 default='Out.tsv',
 help="Out put file name for str descriptors")
 parser.add_argument("-L", "--List",
-					required=False,
+required=False,
-					default=None,
+default=None,
-					help="List of integer as ID")
+help="List of integer as ID")
 args = parser.parse_args()
 DataGen(args.DataBaseType, args.OutFile, args.List)

Mercurial > repos > jay > pdaug_peptide_ngrams