近年來,蛋白質(zhì)相關(guān)數(shù)據(jù)海量增加,極大地促進(jìn)了蛋白質(zhì)組學(xué)的發(fā)展,高通量蛋白質(zhì)組學(xué)數(shù)據(jù)挖掘研究已成為國(guó)內(nèi)外生物信息學(xué)研究的熱點(diǎn)和學(xué)科前沿。蛋白質(zhì)的功能、代謝以及信號(hào)傳導(dǎo)等生物過程都與其亞細(xì)胞定位密切相關(guān),新合成的蛋白質(zhì)必須處于合適的亞細(xì)胞位置才能正常行使其功能。而異常的蛋白質(zhì)亞細(xì)胞位置能夠影響蛋白質(zhì)的功能,并與人類疾病息息相關(guān),如阿爾茲海默癥、肝臟腫瘤、乳腺癌、小唾液腺腫瘤、腎結(jié)石和巴特綜合征等。研究發(fā)現(xiàn)越來越多的蛋白質(zhì)屬于兩個(gè)或多個(gè)亞細(xì)胞位置,這些多標(biāo)記蛋白質(zhì)通常具有復(fù)雜的合成、排列和代謝機(jī)制,具有特殊的生物學(xué)功能。隨著高通量蛋白質(zhì)測(cè)序技術(shù)的發(fā)展,通過實(shí)驗(yàn)方法識(shí)別多標(biāo)記蛋白質(zhì)已遠(yuǎn)遠(yuǎn)不能滿足研究的需要,因此發(fā)展快速高效的人工智能方法對(duì)多標(biāo)記蛋白質(zhì)亞細(xì)胞位置的精準(zhǔn)預(yù)測(cè)仍是生物信息學(xué)的一項(xiàng)挑戰(zhàn)任務(wù)。
近日,青島科技大學(xué)數(shù)理學(xué)院人工智能與生物醫(yī)學(xué)大數(shù)據(jù)研究團(tuán)隊(duì)于彬副教授,在生物信息學(xué)頂級(jí)期刊Briefings in Bioinformatics (IF=8.990) 上發(fā)表題為“Accurate prediction of multi-label protein subcellular localization through multi-view feature learning with RBRL classifier”的研究論文。報(bào)道了構(gòu)建預(yù)測(cè)多標(biāo)記蛋白質(zhì)亞細(xì)胞位置的人工智能模型—Mps-mvRBRL。該模型表現(xiàn)出較強(qiáng)的魯棒性和泛化能力。于彬副教授為論文的通訊作者,研究生張琪、副教授張艷丹并列第一作者,青島科技大學(xué)為第一完成單位。
本研究摒棄傳統(tǒng)首尾相接的融合方式,根據(jù)單特征編碼算法的性質(zhì),首次引入差分進(jìn)化算法學(xué)習(xí)五種單特征的權(quán)重向量,通過加權(quán)形式融合多視圖信息。將融合后的高維特征使用基于二進(jìn)制權(quán)重形式的加權(quán)多標(biāo)簽線性判別分析法 (wMLDAb) 去除冗余信息。此外,本研究首次使用由Rank-SVM和BR算法結(jié)合低秩學(xué)習(xí) (RBRL) 算法預(yù)測(cè)多標(biāo)記蛋白質(zhì)亞細(xì)胞的位置。通過最嚴(yán)格的留一法檢驗(yàn),Mps-mvRBRL預(yù)測(cè)模型在革蘭氏陰性菌、革蘭氏陽性菌、病毒及植物數(shù)據(jù)集均優(yōu)于其它已報(bào)道的先進(jìn)預(yù)測(cè)模型。且Mps-mvRBRL模型的時(shí)間復(fù)雜度低,具有優(yōu)異的預(yù)測(cè)能力和計(jì)算穩(wěn)定性。Mps-mvRBRL模型能夠準(zhǔn)確預(yù)測(cè)多標(biāo)記蛋白質(zhì)亞細(xì)胞位置,并能夠應(yīng)用到更多的多標(biāo)記蛋白質(zhì)屬性預(yù)測(cè)中。通過對(duì)多標(biāo)記蛋白質(zhì)亞細(xì)胞位置的預(yù)測(cè)研究,為確定蛋白質(zhì)功能提供重要線索,有助于了解蛋白質(zhì)之間相互作用和調(diào)控機(jī)制,對(duì)某些疾病的發(fā)病機(jī)理和新藥研發(fā)具有重要意義。
文章鏈接:https://doi.org/10.1093/bib/bbab012
Briefings in Bioinformatics是牛津大學(xué)出版社 (Oxford Academic) 出版的JCR一區(qū)頂級(jí)期刊,2020年的影響因子為8.990,在SCI收錄的59個(gè)“Mathematical & Computational Biology”類期刊中排名第1,在SCI收錄的79個(gè)“Biochemical Research Methods”類期刊中排名第3。