2009年1月6日星期二

awk 小编程

     之前在http://www.ibm.com/developerworks/cn/linux/shell/awk/awk-1/ 上看过awk编程的介绍,说可以修改RS,FS内置变量来处理不同格式的文件。今天师姐让我处理一个fasta格式的文件,想提取仅仅人类的序列,人类的序列在">......"有关键字“Homo sapiens”字样,基于fasta格式文件的特定格式,想提取这些数据,仅仅几行就能搞定。如下
-----------------------------------------------
BEGIN{RS=">";FS="\n";OFS="";ORS=""}
$1~"Homo sapiens" {print ">",$0}
-----------------------------------------------------------------------------------------------------------------------
仅仅两行,轻松搞定,嘻嘻!

没有评论: