虽然人们对circRNA的价值期望很高,但是在对它的认识还令人捉急。已被证实的真实的circRNA寥寥无几,所以并没有一个金标准来评估circRNA的识别方法和流程。因此,对已有的方法进行评估从而寻找最优识别策略,对于研究circRNA非常关键。
在2015年10月,Hansen, et.al.在NAR上发表了5种方法(circRNA_finder, find_circ, CIRCexplorer, CIRI, MapSplice)的比较。本来作者打算比较七种方法,但另外两种方法KNIFE和segemehl作者没有实现(PS. KNIFE我也没有实现,给作者Linda Szabo发送报告,也没了下文……)。作者使用了RNase R处理和未处理的对照样本(2x2,来源于Jeck, et.al.,20132), RNase R处后获得的circRNA为真阳性,RNase R降解掉的circRNA作为假阳性——这样设定有很大的局限性,因为许多circRNA都能够被降解掉, 包括已证实的CDR1as(Salzman, 20163)。
文章从识别数量、敏感性、真阳性率、运行速度、所耗内存等方面对5种方法进行了评估,并汇总成了一个表。
另外,作者发现两两方法组合能使假阳性率很大程度地降低——单个为12%~28%,5种方法为6%, 两两为8%~12%。如果有意向但没时间研究所有方法,建议阅读原文看两两方法的评估。最后,作者表示,如果想要更快地获得circRNA,使用circRNA_finder和find_circ组合是一个不错的选择。
参考文献 1Hansen T B, Venø M T, Damgaard C K, et al. Comparison of circular RNA prediction tools[J]. Nucleic acids research, 2016, 44(6): e58-e58. 2Jeck W R, Sorrentino J A, Wang K, et al. Circular RNAs are abundant, conserved, and associated with ALU repeats[J]. Rna, 2013, 19(2): 141-157. 3Szabo L, Salzman J. Detecting circular RNAs: bioinformatic and experimental challenges[J]. Nature Reviews Genetics, 2016, 17(11): 679-692.