自從作物被馴化以來,培育集抗性強、優質、高產等性狀為一體的作物品種一直是育種家的夢想。DNA分子結構模型的發現推動了分子生物學的發展,讓育種家們能夠從基因和分子水平上解碼作物的生命秘密,通過調控基因獲得特定表型,以期培育出最想要的作物品種。
然而,如何調控作物基因才能培育優良品種?如何不用大規模田間試驗就能預測基因變異后的作物生長狀況?時至今日,這些問題依然困擾著育種學家們。
近日,中國農業科學院生物技術研究所副研究員汪海與合作者共同開發出從基因組DNA序列預測基因表達調控模式的人工神經網絡模型,有望借助人工智能(AI)技術實現定向育種。相關成果發表在《美國科學院院刊》上。
從經驗到精準定向
育種,從某種意義上來說,是把來自不同種質資源的優良等位基因聚合起來。
作物育種經歷了漫長的改良之路。傳統育種是耕作者對作物表型變異的肉眼觀察,通過主觀判斷選出高產優質抗性強的育種材料。后來,職業育種家出現,他們根據對作物遺傳規律的認識,通過預先設計雜交育種試驗,再從后代中篩選出優良栽培品種。
這些方法曾為作物改良、有效解決糧食安全問題作出了巨大的貢獻。但在某種程度上,卻都是基于經驗和觀察,完全根據表型對育種材料進行選育的“經驗育種”。科學家曾“無奈”而又形象地將其形容為“一把尺子一桿秤,用牙咬,用眼瞪”。
“作物表型易受環境、氣候等因素影響,依賴于經驗育種效率低,且成本高、田間管理難度大。過去幾十年甚至上百年來,基本是沿用這種方式,并無大的突破。”華南農業大學生命科學學院教授王海洋告訴《中國科學報》。
直到20世紀50年代,分子生物學與基因工程的誕生,打開了人類認識生命本質的大門。作物育種從經驗育種時代進入了分子定向育種時代。這個時期,育種家可在明確基因型的表型效應的情況下,有的放矢地把符合預期要求的基因型進行組合。
“找到控制作物最佳性狀的基因,對其進行標記,在后代中監測追蹤,從而有目的地對單一目標性狀進行基因改良,大大提高了育種效率和精確度。”王海洋說。
然而,伴隨著高通量基因組測序技術的發展,越來越多的作物全基因組密碼被解開。在海量的基因組數據面前,控制優良性狀的基因是哪些?怎樣的基因組合才能產出最優的作物品種?上述分子標記有效利用與定向育種的先決條件,人們卻不得而知。
汪海表示,明確哪些分子標記和哪些性狀相關聯,需要借助機器學習模型或深度學習模型幫助育種家根據基因型預測表型。人工智能技術突破了人的經驗,使作物育種更加精準而高效。
深度學習模型幫助預測優勢品種
機器學習是借助計算機算法建立模型并解析數據,通過不斷學習數據的自身特征并訓練模型,從而實現對目標對象的判斷和預測。
汪海告訴《中國科學報》,傳統的基于線性模型的機器學習方法由于不考慮生物學過程背后的分子機制,造成模型不會“舉一反三”,在某個基因上學習到的特征不能運用到相似分子機制的基因,而且不能有效預測低頻、罕見變異的表型效應。以玉米為例,玉米自然群體中就有超過50%的變異屬于低頻、罕見變異。
以基因組序列為預測變量的深度學習模型可以克服這一難點。
研究人員以基因家族代替單個基因為單位隨機分配訓練集和測試集數據,以解決“進化依賴”造成的模型“過擬合”問題。接著進一步利用多種算法對模型進行解析,獲得了調控基因表達的關鍵DNA基序。在此模型基礎上,研究人員利用進化上親緣關系較近的兩個物種,成功預測了同源基因的相對表達量,并進一步獲得了調控同源基因相對表達量的關鍵DNA基序。
汪海表示,深度學習模型通過模擬分子生物學過程,可在自然群體中預測直接造成表型的因果變異,而非和因果變異緊密連鎖的變異。未來可以針對因果變異進行基因組編輯,直接將有利自然變異引入現有的育種材料。
此外,與傳統高投入、大規模的田間試驗相比,人工神經網絡模型可在計算機中對基因組DNA序列進行虛擬誘變,并利用模型預測變異的后果。“從而再挑選符合預期目標的變異序列進行實驗驗證,實現低成本定點定向設計育種。”汪海說。
智能化育種4.0時代
“這是作物優良基因挖掘方法的突破,也代表了未來的發展方向。”中國農業大學農學與生物技術學院植物遺傳育種學系教授、國家玉米改良中心主任李建生告訴《中國科學報》。
以人工神經網絡為代表的新一代人工智能技術具有更強大的數據挖掘能力,正推動作物育種走向智能化的“4.0”時代。
中國農業大學作物基因組與生物信息學系教授王向峰撰文以玉米為例,對育種“4.0時代”進行了詳細的闡釋:依托人工智能、基因組測序、基因編輯等相關技術,實現玉米組學基因型與表型大數據的快速積累,通過遺傳變異等數據的整合,實現作物性狀調控基因的快速挖掘與表型的精準預測,通過人工改造基因元器件與人工合成基因回路,使作物具備新的抗逆、高效等生物學性狀,并通過在全基因組層面上建立機器學習預測模型,創建智能組合優良等位基因的自然變異、人工變異、數量性狀位點的育種設計方案,最終實現智能、高效、定向培育新品種。
在人工智能技術輔助育種方面,美國農業公司已有應用。比如原孟山都公司,通過人工智能篩選,只需對最具開發潛力的品種分子進行田間測試,即可幫助農民增收。此外,借助機器學習和預測建模技術,快速為農民提供數字化解決方案。
“中國要實現應用還有一段路程要走。”李建生表示,與國外農業公司種業集中度高、規模大相比,中國種業公司多為“作坊式”生產且分布分散,要實現高通量的基因篩選與預測,需要改良適合中國種業發展的模型和方法。
在研究方面,汪海坦承,目前,把深度學習等人工智能技術應用于基因組學領域在國內外都剛剛起步。
在他看來,阻礙人工智能技術在基因組學中廣泛應用的因素之一是跨領域人才缺乏。“基因組學領域的人需要學習和掌握人工智能技術方法,并根據基因組學領域問題的特殊性,對人工智能技術進行改造。”
除此之外,訓練深度學習模型需要大量的數據。然而在農業領域,作物的基因型和表型數據量卻積累不足。
王海洋建議,研究人員在育種后,除了留下優質品種數據,也要保存非理想型品種的全套基因組和表型數據,以便數據建模時進行優劣比較,找出調控優良表型性狀的基因。
大數據時代下智能化育種的前提是標準化大數據體系。而農業數據采之不易且不統一,王海洋表示,作物表型數據差異性較大,不同人采集的數據真實可靠性與準確性也難以控制。除此之外,彼此數據不開放共享,使得研究中可比較的數據量少。“有數據是第一步。對數據進行規范化采集處理、存儲與管理,并建立開放共享的數據庫更重要。”
-
人工智能
+關注
關注
1799文章
47961瀏覽量
241274 -
深度學習
+關注
關注
73文章
5523瀏覽量
121718
原文標題:人工智能讓育種“物美價廉”
文章出處:【微信號:AItists,微信公眾號:人工智能學家】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
嵌入式和人工智能究竟是什么關系?
人工智能、機器學習和深度學習存在什么區別

評論