序列注释分析一例
-
某次测序结果中包括下面的序列 被分别注释为人类和疟原虫:
AGTATACTTCGTTCAGTTACGTATTGCTAAGGTTAAAAGGTTACACAAACCCTGGTAAGCAGCACCCTTATTGTAACTCTTTCTCAGTAGTGATTTTACACTTCCAGGGTGCAATTTGCTGGTCGGTGTCATCTCCTGCAGGAGACAATGGGCTCCTTGAGGGCTGCGCGTCATGGTCACTGTTGAATCCCCACTGATCCCACCACGGAAGGGTGACTGAGTATTTGTTGAGTGAATAGTCAGGCCACTGAAGTTGGAGGCAGACGCCAGGTACCCCTCTGCCACCCTGTTCATAGGATTATTACTGAGGGAGAAATACAGGAGATGGCCAGGGGCAGGTCCCCACTCCCTCAGTAATAATCTTATGAACAGGTGGCAGGGGTGCCTGGCGTCTGCCTCCGACTTTGCTATCTGACTATTCACTCAACAAATATCAGCTCTCCCGTGTGGATCAGTGGGGCATTCAGCAGTGACCGGGGACAAGGCAGCCCCTCCAAGGAGCCCATTGTCTGCTGCAGGAGACAGACACTGACTCTGGAATTGCACCTGGAAGTGAAATCACTACTGGAGAAAGAGCTACAAATAAGGTGCTGCTTGTCCAGGGTTTGTGTAACCTTTTAACCTTAATAATACGTAGCAblast结果

可以发现 该序列的某个部分(blast显示占查询序列的5%) 和疟原虫完全匹配:

这个显然是假阳性 虽然blast的identity为100% 但是占比很低 这种最后肯定也是人的序列