python文本处理--定位motif在fasta文件上的位置,并给出位置信息
#!/usr/bin/python3 #-*- coding:utf-8 -*- #在序列文件上找出所有的指定motif的位置 dna='ATGCGAGAGAGAGAGAAGTGCTGTGTAGCTGATGCGCTAGTTTCGCGCTAGAGAGTGTAAAATTGGAGAGTGTAGTAGTGTA' motif='GTGTA' l=[] import re matches=re.finditer('(?=GTGTA)', dna) for match in matches: loc=match.start()+1 l.append((loc, loc+len(motif)-1)) print(l)
输出结果:
[(23, 27), (55, 59), (70, 74), (78, 82)]