8月27日,Molecular Plant 在線發(fā)表了華中農(nóng)業(yè)大學(xué)李國(guó)亮教授和李興旺教授團(tuán)隊(duì)聯(lián)合發(fā)表的題為 RiceENCODE: a comprehensive epigenomic database as rice Encyclopedia of DNA Elements 的研究論文,報(bào)道了一個(gè)整合水稻多元表觀基因組數(shù)據(jù)的數(shù)據(jù)庫(kù)。
該數(shù)據(jù)庫(kù)基于團(tuán)隊(duì)此前發(fā)表的水稻20個(gè)品系參考表觀基因組圖譜(https://www.nature.com/articles/s41467-020-16457-5 )和水稻高分辨率三維基因組結(jié)構(gòu)數(shù)據(jù) (https://www.nature.com/articles/s41467-019-11535-9 ),收集了公開(kāi)發(fā)表的水稻多品種多組織多維度的表觀基因組信息,展示了水稻不同類型的染色質(zhì)調(diào)控元件,立體地呈現(xiàn)了水稻品種和組織間復(fù)雜的基因表達(dá)調(diào)控關(guān)系。這是參照人類的ENCODE計(jì)劃,推進(jìn)水稻功能基因組研究的重要一步。
圖1. 水稻DNA調(diào)控元件數(shù)據(jù)庫(kù)RiceENCODE的框架結(jié)構(gòu)
圖2. 水稻的染色質(zhì)交互遠(yuǎn)程網(wǎng)絡(luò)和瀏覽器截圖
該數(shù)據(jù)庫(kù)收集了包括ChIP-seq, ATAC-seq, MNase-seq, FAIRE-seq, BS-seq, RNA-seq, ncRNA-seq, Hi-C和ChIA-PET 等共計(jì)972套水稻高通量組學(xué)數(shù)據(jù),通過(guò)標(biāo)準(zhǔn)化的數(shù)據(jù)處理流程,得到了多維度的高質(zhì)量表觀和三維基因組數(shù)據(jù)(參見(jiàn)圖1)。
研究者構(gòu)建了綜合的數(shù)據(jù)庫(kù)搜索頁(yè)面,用戶可在數(shù)據(jù)庫(kù)的基因組瀏覽器中查看不同品種、多種組織的表觀基因組數(shù)據(jù)。用戶可根據(jù)自己需求,選擇不同類型的表觀基因組數(shù)據(jù),查詢目標(biāo)區(qū)域或目標(biāo)基因的表觀修飾信息。該數(shù)據(jù)庫(kù)還提供了大量結(jié)果數(shù)據(jù)信息,這些數(shù)據(jù)文件都可在下載頁(yè)面下載。用戶可根據(jù)自己的需要進(jìn)行下游分析。
另外,該數(shù)據(jù)庫(kù)引入了水稻三維基因組數(shù)據(jù)。用戶不僅可以查詢目標(biāo)區(qū)間參與的所有染色質(zhì)遠(yuǎn)程交互信息,還可查詢兩兩基因之間擁有的多層級(jí)交互基因網(wǎng)絡(luò),為水稻多基因之間共轉(zhuǎn)錄、共調(diào)控提供參考(圖2)。
總之,該數(shù)據(jù)庫(kù)全面展示了多維度水稻表觀基因組數(shù)據(jù),涵蓋了水稻不同品系不同組織間的表觀基因組動(dòng)態(tài)變化模式,為水稻功能基因組研究領(lǐng)域提供了解析水稻表觀基因組和染色質(zhì)遠(yuǎn)程互作信息的重要研究平臺(tái)。
人類的疾病和動(dòng)植物的表型性狀,都與該物種的基因正確表達(dá)密切相關(guān)。而基因的表達(dá),不完全由基因的DNA序列決定,而是同時(shí)與DNA調(diào)控元件的調(diào)控息息相關(guān)。2003年提出并實(shí)施的人類ENCODE計(jì)劃(即DNA調(diào)控元件百科全書(shū)計(jì)劃)通過(guò)整合DNA、RNA和表觀修飾等多個(gè)層面的數(shù)據(jù)建立了多組學(xué)的人類基因組DNA調(diào)控元件數(shù)據(jù)庫(kù),注釋了人類基因組中數(shù)以百萬(wàn)計(jì)的DNA調(diào)控元件,增強(qiáng)了我們對(duì)人類功能基因組的理解。同時(shí),ENCODE計(jì)劃的一系列技術(shù)和成果,為后續(xù)人類或模式生物基因調(diào)控的功能挖掘提供了極大幫助和支持。
水稻(Oryza sativa L.)是我國(guó)乃至世界重要的糧食作物,同時(shí)也是基礎(chǔ)研究的重要模式植物。水稻基因組DNA順式調(diào)控元件的注釋和鑒定,對(duì)理解水稻基因表達(dá)調(diào)控機(jī)理有重要意義。因此,一個(gè)整合了水稻多元表觀基因組數(shù)據(jù)的數(shù)據(jù)庫(kù),將極大地方便研究人員查詢和分析水稻的表觀遺傳信息,促進(jìn)水稻表觀和三維基因組研究。
課題組負(fù)責(zé)人介紹,基因的正確表達(dá),相當(dāng)于一個(gè)機(jī)器的正常運(yùn)行,需要各個(gè)零件的正常工作。而水稻基因表達(dá)涉及多少零件,以前的知識(shí)是零散的。這數(shù)據(jù)庫(kù)相當(dāng)于發(fā)布了水稻基因轉(zhuǎn)錄調(diào)控的“零件庫(kù)”,方便大家在研究中選取合適的零件,組成基因表達(dá)的機(jī)器,正確表達(dá)相關(guān)基因。打個(gè)形象的比方即相當(dāng)于樂(lè)高中的零件,現(xiàn)在整理出來(lái)一個(gè)最完整的“零件庫(kù)”和相對(duì)完整的“零件列表”,大家可選擇自己想要的零件,組裝自己想要的機(jī)器。
李國(guó)亮教授和李興旺教授為通訊作者,博士生謝亮為文章第一作者。該研究得到國(guó)家重點(diǎn)研發(fā)計(jì)劃,國(guó)家自然科學(xué)基金和華中農(nóng)業(yè)大學(xué)自主科技創(chuàng)新基金的支持。
Abstract:Rice (Oryza sativa L.) is one of the most important crops in the world and a common model plant for genomic research. In recent years, the application of Hi-C, ChIA-PET, and other chromosome conformation capture technologies in rice had made it more and more important to study the epigenomics and the spatial structure of rice genomes. Epigenomics and three-dimensional (3D) genomic structures are essential in research for development and breeding. However, it is still a big challenge for many groups that lack dedicated bioinformatic personnel or sufficient computational resources to utilize such epigenetic data. In this study, we combined the published three-dimensional interactive data ChIA-PET, Hi-C, transcriptome data (RNA-Seq) and the epigenomic datasets (ChIP-Seq, ATAC-Seq, MNase-Seq, FAIRE-Seq, WGBS) to construct a comprehensive epigenomic database as rice Encyclopedia of DNA Elements (RiceENCODE http://glab.hzau.edu.cn/RiceENCODE)。 This database contains 972 data sets, which is the largest one for rice epigenomics up to our best knowledge. We hope that such a comprehensive rice epigenome database could serve as an important platform for studying molecular breeding, subpopulation comparison, and differences of epigenetic regulation in rice.
原文鏈接:https://www.sciencedirect.com/science/article/pii/S1674205221003312