近日,中國農業(yè)科學院生物所創(chuàng)新團隊聯(lián)合攻關開發(fā)了基于人工智能的水稻染色質開放性在線預測模型,為水稻染色質開放性及其轉錄調控研究提供了新思路。相關成果發(fā)表在《遺傳學和基因組學雜志(Journal of Genetics and Genomics)》上。
染色質物理狀態(tài)由DNA折疊和縮合決定,一般分為常染色質和異染色質兩種狀態(tài),但兩者并不是靜態(tài)不變的,而是隨著生長發(fā)育、環(huán)境響應等變化動態(tài)調整。染色質開放性(chromatin accessibility)反映了染色質轉錄活躍程度,結合其它表觀遺傳修飾如DNA甲基化等信息,可以提供全基因組的基因表達調控信息。因此,識別染色質開放性區(qū)域對理解基因表達調控如何協(xié)調生長發(fā)育與對環(huán)境刺激的響應至關重要。由于受實驗技術所限,大量染色質開放性區(qū)域至今仍未得到完全鑒定,因此開發(fā)基于人工智能的預測方法顯得尤為重要。
本研究通過分別使用正常和熱處理條件下秈粳稻的染色質開放性數(shù)據(jù),進行智能預測模型(Smart Model for Open Chromatin region prediction, SMOC)構建。在秈粳稻模型之間的交叉驗證中,預測數(shù)據(jù)和實驗數(shù)據(jù)的皮爾森相關系數(shù)均在0.97以上。與其它機器學習方法進行性能比較發(fā)現(xiàn)SMOC具有更優(yōu)性能。此外,染色質開放性和DNA甲基化6mA的關聯(lián)分析結果表明,染色質開放性可能與6mA協(xié)同調控基因表達。本研究開發(fā)建立了一個染色質開放性智能預測模型(http://www.elabcaas.cn/smoc/index.html),可以快捷地進行染色質開放性預測。為染色質開放性區(qū)域鑒定和信息挖掘提供新的研究思路,結合之前建立的水稻智能數(shù)據(jù)庫eRice(2020)、作物表觀遺傳智能預測模型SMEP(2021)等,初步形成鏈條式智能算法開發(fā)和模型構建,將為今后作物智能設計育種提供新的數(shù)據(jù)資源和工具。
生物所博士生郭位軍、碩士生劉汗青、王一凡及已畢業(yè)博士生張平賢為該論文共同第一作者,普莉研究員、田健研究員和谷曉峰研究員為共同通訊作者。相關工作得到國家自然科學基金、中央級公益性科研機構基本科研業(yè)務費等項目資助。
原文鏈接:
https://www.sciencedirect.com/science/article/pii/S1673852722000522?via%3Dihub