RLE: Run Length Encoding
举个例子目标碱基序列是AACGAAATT,测序仪按照CGAT顺序输入反应物。这个碱基序列的RLE编码是<C,0><G,0><A,2><T,0><C,1><G,1><A,3><T,2>,RLE编码的第一个字符表示当前反应的碱基,第二个数字表示反应的数目。
上一篇介绍了测序仪的Error Model,对于454,Error Model 是 P( Intensity | Run Length )。把Error Model变换成序列比对的打分函数(Scoring Function),再设定插入删除的分值,就可以用动态规划做比对了。作者: zouquan 时间: 2011-7-19 16:48
赞,
没见过454的原始数据,我拿到的就是一个fasta文件和一个对应的qual文件,qual文件是fasta中每一位的质量,一般从30-45;