资讯

中科院昆明动物所发布生物序列处理工具FasParser2

从大量的序列数据中挖掘有用的生物学信息,已成为众多研究领域的必备手段。针对数据挖掘过程中序列处理的操作,已有一些优秀工具包供使用,大致可以分为两类:一类是EMBOSS等命令行程序,其特点是运行速度较快,灵活性高,可与其他工具融合形成分析流程和批处理化。但这类工具往往需要用户熟悉Unix-like操作系统,甚至要求用户具有编写脚本能力。另一类是MEGA、BioEdit等窗口程序,该类工具具有友好的用户操作界面,使用起来方便,但往往只能对单文件进行操作,且难与其他程序形成自动化分析流程,难以应付越来越多的序列文件。2017年,中国科学院昆明动物研究所两栖爬行类多样性与进化研究组博士孙艳波于2017年在Zoological Research发布了FasParser程序,以实现在友好界面窗口下对一些常规序列的操作,尤其是对多基因串联合并、序列提取、低质量序列鉴定等进行批处理化。

近日,孙艳波对FasParser进行了较大幅度的更新,并以FasParser2: A Graphical Platform for Batch Manipulation of Tremendous Amount of Sequence Data为题,在生物信息学期刊Bioinformatics上发布了新版本,以满足科研人员对序列操作更高的需求。更新内容包括:重新设计的文件上传界面具有更好的批处理效率;增加了有效过滤序列比对质量的模块,尤其适用于大规模检测序列中经历达尔文正选择的位点,以及重建系统发育等分析;增加若干序列过滤的功能,可实现序列中对非同源序列的清除,尤其适用于从一堆数据中抽取感兴趣的序列;增加了蛋白序列的一些操作接口,如利用蛋白序列的比对结果生成DNA的比对结果等;增加了检测正选择(借助PAML)、PCR引物设计(借助Primer3)的功能;增加了专门的序列编辑工具(FasParser::Editor),以实现更方便的序列查看和编辑功能;增加其它一些附属功能。

该研究得到了国家自然科学基金面上项目、中科院战略性先导科技专项、中科院青年创新促进会的资助。

(1)

本文由来源 昆明动物研究所,由 王迪 整理编辑!

热评文章