3月15日,中國(guó)煙草基因組數(shù)據(jù)庫(kù)(1.0版)面向行業(yè)開放運(yùn)行。中國(guó)煙草基因組數(shù)據(jù)庫(kù)的開放運(yùn)行,標(biāo)志著煙草基因組計(jì)劃重大專項(xiàng)取得了新的進(jìn)展。
中國(guó)煙草基因組數(shù)據(jù)庫(kù)設(shè)在國(guó)家煙草基因研究中心,由國(guó)家煙草基因研究中心負(fù)責(zé)數(shù)據(jù)庫(kù)管理和維護(hù)。數(shù)據(jù)庫(kù)儲(chǔ)存了去年底繪制的絨毛狀煙草和林煙草全基因組序列圖譜的所有原始數(shù)據(jù)以及基因注釋結(jié)果,總數(shù)據(jù)量將近7T。這兩張序列圖譜是目前已知植物基因組序列圖譜中基因組最大、組裝精度最高、組裝結(jié)果最好的2個(gè)圖譜,染色質(zhì)區(qū)覆蓋度達(dá)到95%以上,基因區(qū)覆蓋度達(dá)到98%以上,contig N50超過30Kb,scaffold N50超過1100Kb,全面達(dá)到國(guó)際公認(rèn)高質(zhì)量精細(xì)圖譜標(biāo)準(zhǔn)。同時(shí),數(shù)據(jù)庫(kù)還開發(fā)了Blast、GBrowse、ClustalW、CAP3等工具,能夠?qū)崿F(xiàn)序列相似性比較、基因組瀏覽、多序列比對(duì)、序列拼接等生物信息學(xué)分析,可對(duì)35852(絨毛狀煙草)和31670(林煙草)個(gè)預(yù)測(cè)基因及注釋結(jié)果進(jìn)行檢索和查詢。
隨著煙草基因組計(jì)劃重大專項(xiàng)的持續(xù)推進(jìn),中國(guó)煙草基因組數(shù)據(jù)庫(kù)后續(xù)將不斷地進(jìn)行功能升級(jí)和擴(kuò)展改版。栽培煙草全基因組序列圖譜、煙草核心種質(zhì)重測(cè)序、煙草連鎖圖譜等數(shù)據(jù)都將儲(chǔ)存到中國(guó)煙草基因組數(shù)據(jù)庫(kù)。同時(shí),重大專項(xiàng)產(chǎn)生的煙草代謝組學(xué)、煙草突變體庫(kù)等信息數(shù)據(jù)也將納入到中國(guó)煙草基因組數(shù)據(jù)庫(kù)中來,形成統(tǒng)一的生物信息學(xué)分析平臺(tái),對(duì)后續(xù)煙草基因組計(jì)劃重大專項(xiàng)的深入開展提供數(shù)據(jù)和技術(shù)支持。