近期,國際知名學(xué)術(shù)期刊“Bioinformatics”(生物信息學(xué))發(fā)表了深圳大學(xué)數(shù)學(xué)科學(xué)學(xué)院統(tǒng)計(jì)學(xué)系周彥副教授與其碩士生張穎、彭敏嬌、溫州醫(yī)科大學(xué)蘇建忠教授與其研究生張雅茹、李成浩、舒連杰、深圳大學(xué)胡耀華教授、香港城市大學(xué)徐錦峰副教授合作的學(xué)術(shù)論文“scDMV: a zero–one inflated beta mixture model for DNA methylation variability with scBS-seq data”。
單細(xì)胞DNA差異甲基化區(qū)域檢測是生物信息學(xué)領(lǐng)域的熱門研究問題之一,利用單細(xì)胞重亞硫酸氫鹽測序技術(shù)(scBS-seq)可以在單個(gè)細(xì)胞水平上精確分析DNA甲基化模式,從而鑒定罕見群體,揭示細(xì)胞特異性表觀遺傳變化,并改進(jìn)差異甲基化分析。然而,測序深度和覆蓋范圍有限,使得數(shù)據(jù)稀疏并且出現(xiàn)大量的0和1,導(dǎo)致使用scBS-seq數(shù)據(jù)進(jìn)行差異甲基化檢測的精度較低。因此,迫切需要一種能夠有效應(yīng)對數(shù)據(jù)稀疏且0-1膨脹的新的差異甲基化分析方法,提高差異甲基化區(qū)域識(shí)別精度。
針對上述挑戰(zhàn),本文提出了一種新方法,稱為scDMV,用于分析單細(xì)胞重亞硫酸氫鹽測序數(shù)據(jù)的甲基化差異,該方法能適應(yīng)低輸入序列并有效地處理過量的0和1。大量的模擬實(shí)驗(yàn)和實(shí)際數(shù)據(jù)分析表明,scDMV方法在靈敏度、精度和控制假陽性率方面顯著優(yōu)于現(xiàn)存的方法。此外,scDMV還揭示了單細(xì)胞全基因組測序數(shù)據(jù)中基因本體富集分析的重要信息,這些信息往往被其他方法所忽視。
全文鏈接:https://doi.org/10.1093/bioinformatics/btad772