python文本处理,计算fasta文件k-mer子串
#例如: dna = "GATGGAACTTGACTACGTAAATT" ##输出结果: """['GAT', 'ATG', 'TGG', 'GGA', 'GAA', 'AAC', 'ACT', 'CTT', 'TTG', 'TGA', 'GAC', 'ACT', 'CTA', 'TAC', 'ACG', 'CGT', 'GTA', 'TAA', 'AAA', 'AAT', 'ATT'] """ """计算k-mer字串的方法: 本例中设置k-mer为3 """ dna='GATGGAACTTGACTACGTAAATT' t=0 l=[] for index in range(len(dna)): t=dna[index,index+3] if (len(t))==3: l.append(t) print(l)