茶樹是重要的經(jīng)濟(jì)作物,起源于中國并在世界范圍內(nèi)產(chǎn)生重要影響。令人愉悅的香味和沉淀千年的文化使茶成為除水之外最受大眾喜愛的健康飲品。近年來隨著測(cè)序技術(shù)的發(fā)展,多個(gè)茶樹全基因組物理圖譜被破譯[1-8],但仍然缺乏對(duì)烏龍茶之首鐵觀音基因組的研究。
由福建農(nóng)林大學(xué)尤民生教授和中國農(nóng)業(yè)科學(xué)院(深圳)農(nóng)業(yè)基因組研究所(以下簡(jiǎn)稱“基因組所”)張興坦研究員主持,聯(lián)合國內(nèi)外多家單位的科學(xué)家共同合作成功破解鐵觀音基因組和茶樹演化史,研究成果于2021年7月15日以“Haplotype-resolvedgenomeassemblyprovidesinsightsintoevolutionaryhistoryoftheteaplantCamelliasinensis”為題發(fā)表在國際頂級(jí)期刊《自然遺傳學(xué)》(NatureGenetics)上。研究人員利用獨(dú)立開發(fā)的新算法攻克高雜合、高重復(fù)鐵觀音基因組組裝難題,并在此基礎(chǔ)上闡述了等位基因不平衡、茶樹群體演化和馴化等相關(guān)科學(xué)問題。
成功破解鐵觀音單倍體分型組裝技術(shù)難題
鐵觀音原產(chǎn)于福建省泉州市安溪縣西平鎮(zhèn),相傳于清朝雍正年間被當(dāng)?shù)夭柁r(nóng)發(fā)現(xiàn),因其葉形似觀音臉重如鐵而被乾隆賜名為“鐵觀音”。
茶樹是自交不親和植物,更因長期的無性繁殖積累大量體細(xì)胞突變,導(dǎo)致基因組高度雜合、組裝難度很大。
研究團(tuán)隊(duì)利用自主開發(fā)的兩種算法(Khaper和ALLHiC)整合Illumina短讀長、PacBioCLR長讀長和高通量三維染色質(zhì)捕獲技術(shù)(Hi-C),攻克高雜合基因組組裝難題,成功拼接了兩套鐵觀音基因組(圖1):?jiǎn)伪扼w參考基因組(monoploidreferencegenome)和單倍體分型基因組(haplotype-resolvedgenome)。茶樹是二倍體,含有15對(duì)同源染色體(2n=2x=30),單倍體參考基因組是篩選同源染色體中的一份拷貝作為代表組裝到染色體水平,而單倍體分型基因組是將來源于不同父母本的兩套同源染色體同時(shí)組裝到染色體水平。前者不區(qū)分等位基因,廣泛用于二倍體基因組的組裝;后者區(qū)分等位變異,更完整地呈現(xiàn)二倍體基因組的全部遺傳信息。
圖1.鐵觀音基因組組裝和質(zhì)量評(píng)估。(a)單倍體參考基因組circos圖,呈現(xiàn)15染色體特征;(b)Hi-C熱圖呈現(xiàn)15條染色體組裝質(zhì)量;(c)LAI評(píng)估鐵觀音和已發(fā)表其他茶樹基因組組裝質(zhì)量;(d)鐵觀音單倍體參考基因組和分型基因組的共線性比較。
利用等位優(yōu)勢(shì)基因應(yīng)對(duì)“遺傳負(fù)荷”
鐵觀音距今已有約300年的栽培歷史,長期的無性繁殖積累大量體細(xì)胞突變(包括有害突變),增加了遺傳負(fù)荷(geneticload),導(dǎo)致其適應(yīng)性降低。然而人們對(duì)無性繁殖作物如何應(yīng)對(duì)遺傳負(fù)荷這一問題知之甚少。
傳統(tǒng)的雜種優(yōu)勢(shì)現(xiàn)象可以由顯性效應(yīng)和超顯性效應(yīng)兩種假說解釋:顯性效應(yīng)指?jìng)€(gè)體傾向于利用有利于生長和發(fā)育的優(yōu)勢(shì)等位基因(或顯性基因)而忽略對(duì)個(gè)體不利的劣勢(shì)基因(或隱形基因);超顯性效應(yīng)指雜合等位組合在多種生境下優(yōu)于任一純合等位的現(xiàn)象。
研究人員基于鐵觀音分型基因組組裝,鑒定到14691個(gè)基因具有等位變異。RNA-seq分析顯示,其中1528個(gè)基因存在一致性的等位特異性表達(dá)(consistentallele-specificexpression,consistentASE),即其中一個(gè)等位基因在所有組織和樣本中的表達(dá)都高于另一等位基因;而只有386個(gè)基因存在非一致性的等位特異表達(dá)(inconsistentASE),即兩個(gè)等位基因分別在不同的組織中存在特異高表達(dá)。前者可以被認(rèn)為是具有顯性效應(yīng)的基因,而后者是具有超顯性效應(yīng)的基因。這一結(jié)果顯示,在無性繁殖的茶樹基因組中,顯性效應(yīng)可能是其應(yīng)對(duì)遺傳負(fù)荷的重要機(jī)制。面對(duì)大量積累的體細(xì)胞突變或有害突變,個(gè)體選擇使用未突變或?qū)€(gè)體有利的等位基因維持其正常的生長發(fā)育和對(duì)環(huán)境的適應(yīng)性。
大葉茶與小葉茶存在不同的演化和馴化歷史
茶樹遺傳多樣性較高。
研究人員對(duì)161個(gè)茶樹品種和15個(gè)近緣種大理茶進(jìn)行重測(cè)序分析發(fā)現(xiàn),這些個(gè)體聚類為三組,分別為大理茶(CT)、大葉茶(CSA)和小葉茶(CSS)。其中大葉茶分為兩個(gè)亞組,古大葉茶(ACSA)和栽培大葉茶(CCSA);而小葉茶分為四個(gè)亞組,依據(jù)其主要地理分布可以劃分為川陜贛(SSJ)、浙江和閩北(ZJNFJ)、閩南(SFJ)、兩湖(湖南和湖北)和安徽(HHA)。
遺傳分析顯示各茶區(qū)存在頻繁的種質(zhì)基因交流,其中一些與有記錄的茶樹雜交育種歷史相吻合(圖2)。比如茶樹黃玫瑰品種呈現(xiàn)出鐵觀音與黃棪基因組混合的組分,而黃玫瑰是兩者子代黃觀音和黃棪回交選育的優(yōu)良品種。這種頻繁的基因交流不僅出現(xiàn)在茶樹種內(nèi),在茶樹與近緣種間也普遍存在。研究人員通過對(duì)8個(gè)茶樹品種和山茶屬茶組的12個(gè)近緣物種系統(tǒng)發(fā)育分析發(fā)現(xiàn),這些物種呈現(xiàn)網(wǎng)狀演化模式,而非簡(jiǎn)單的樹形演化。更多的證據(jù)表明,茶樹與近緣種間頻繁的雜交漸滲(introgression)是其網(wǎng)狀演化和維持茶樹遺傳多樣性的重要因素。
圖2.茶樹的系統(tǒng)發(fā)育關(guān)系和群體結(jié)構(gòu)。(a)重測(cè)序個(gè)體的地理分布;(b)系統(tǒng)發(fā)育樹;(c)重測(cè)序群體的主成分分析(PCA);(d)K=7模型下的群體遺傳結(jié)構(gòu)圖,下方顯示了兩個(gè)有記錄的現(xiàn)代繁殖事件。
栽培茶樹品種主要分為大葉茶(C.sinensisvar.assamica,CSA)和小葉茶(C.sinensisvar.sinensis,CSS),兩者之間在形態(tài)上具有明顯差異。前者植株較高、葉片較大、多為喬木,主要生長在云南、廣東等溫度較高的地域;而后者植株較矮、葉片較小、多為小喬木或灌木,可以生長在北至山東等較寒冷地區(qū)。
研究人員通過群體遺傳分析發(fā)現(xiàn)大葉茶和小葉茶具有不同的演化和馴化歷史。在距離約259-181萬年的格拉斯階時(shí)期,劇烈的氣候變化很可能導(dǎo)致了整個(gè)茶樹物種的群體收縮,這也是一次大葉茶和小葉茶共享的瓶頸事件。兩個(gè)變種分化后,小葉茶的生境遭遇了末次冰盛期,2.65-1.9萬年前的溫度驟降可能使得小葉茶出現(xiàn)了再一次的群體瓶頸,但隨后適應(yīng)了環(huán)境的小葉茶迅速擴(kuò)張,群體規(guī)模得到恢復(fù)(圖3)。
圖3.茶樹的群體動(dòng)態(tài)歷史。(a)小葉種(上)和大葉種(下)歷史有效群體大?。唬╞)過去42萬年的歷史溫度變化。
此外,人們對(duì)大葉茶和小葉茶制品的偏愛有所不同也導(dǎo)致了兩者經(jīng)歷了平行的馴化歷程(圖4)。大葉茶早期的馴化主要篩選了一些糖苷類物質(zhì)轉(zhuǎn)運(yùn)的相關(guān)基因,而在品種改良階段人們更關(guān)注生物堿和香氣揮發(fā)物相關(guān)的代謝途徑。
例如,研究人員鑒定到CsXDH基因在大葉茶品種改良階段受到強(qiáng)烈的人工選擇,該基因編碼黃嘌呤脫氫酶,是咖啡因合成通路的重要基因[9]。
小葉茶早期人工選擇的基因與植物防御和抗性相關(guān),事實(shí)上這些受選擇的基因同時(shí)也參與到了重要的次級(jí)代謝產(chǎn)物的生物合成,例如R-檸檬烯、β羅勒烯等途徑。
作為兒茶素合成通路的關(guān)鍵基因,F(xiàn)3’H也在這一過程中受到人工選擇。而在小葉茶品種改良過程中,人工馴化涉及到花發(fā)育和一氧化氮(NO)響應(yīng)相關(guān)的基因。之前的研究表明,NO的積累可以加速γ-氨基丁酸的消耗從而幫助植物抵御冷脅迫[10],這一結(jié)果暗示著篩選耐寒的品種也是人工選育的重要目標(biāo)。
圖4.大葉茶(CSA)和小葉茶(CSS)人工選擇的特征與平行馴化的證據(jù)。(a)CSA與CSS平行馴化路線圖;(b)基于XP-EHH識(shí)別的選擇性清除信號(hào)在全基因組的分布;(c)XDH基因中人工選擇的信號(hào);(d)CM(脈絡(luò)膜類誘變酶)基因中的人工選擇信號(hào);(e)F3’H基因中人工選擇的信號(hào);(f)與植物高度相關(guān)的BAS1和DWF4基因的人工選擇信號(hào);(g)人工選擇基因的表達(dá),包括根(RT)、莖(ST)、花(FL)、芽(BD)、幼葉(YL)、老葉(OL)。
茶樹的“綠色革命”基因
20世紀(jì)60年代,大規(guī)模推廣矮稈或半矮稈的水稻和小麥品種極大的提高了作物產(chǎn)量,解決了發(fā)展中國家急劇增長的糧食需求,控制水稻株高的sd1基因和小麥的rht基因也因其巨大的貢獻(xiàn)被稱為“綠色革命基因”[11]。研究人員發(fā)現(xiàn),茶樹的株高在長期的栽培過程中也受到馴化,體現(xiàn)在兩個(gè)細(xì)胞色素P450家族基因受到人工選擇(CsBAS1和CsDWF4)。這兩個(gè)基因參與油菜素內(nèi)酯合成,前者的擬南芥突變體導(dǎo)致了延長的下胚軸,而后者的突變直接導(dǎo)致了植株侏儒的表型[12-13]。
該項(xiàng)目在攻克鐵觀音基因組的基礎(chǔ)上,通過對(duì)茶樹種群水平的遺傳分析,揭示了該物種的演化和人工馴化歷史。該成果為利用組學(xué)分析和分子生物學(xué)技術(shù)挖掘功能基因、解析其背后的遺傳調(diào)控機(jī)制,開展基于大數(shù)據(jù)驅(qū)動(dòng)的基因組智能設(shè)計(jì)育種奠定了堅(jiān)實(shí)的理論基礎(chǔ),同時(shí)也為縮短育種周期、提高育種效率、降低育種成本提供了科學(xué)依據(jù)。
該項(xiàng)目由福建農(nóng)林大學(xué)、基因組所等國內(nèi)外多家單位合作完成?;蚪M所張興坦研究員、福建農(nóng)林大學(xué)碩士研究生陳帥、福建省農(nóng)科院水稻所施龍清博士、中國農(nóng)科院煙草研究所龔達(dá)平研究員為論文共同第一作者,福建農(nóng)林大學(xué)尤民生教授、唐海寶教授和基因組所張興坦研究員為共同通訊作者。
來源:農(nóng)業(yè)基因組所報(bào)道,信息貴在分享,如涉及版權(quán)問題請(qǐng)聯(lián)系刪除