AI智能體登Nature子刊!華大智造發(fā)布靶向測序引物設計工具PrimeGen
PrimeGen以大型語言模型(LLM)為“中樞大腦”,協(xié)調搜索、引物設計、協(xié)議腳本生成、實驗執(zhí)行與質控四類智能體閉環(huán)協(xié)作,將原本需要高度依賴專家經(jīng)驗的引物設計與實驗執(zhí)行步驟,“搖身一變”成為智能、快速、穩(wěn)定、可追溯、可復制的標準化流程。在多場景實測中,PrimeGen在自研ATOPlex平臺加持下,最多能支持955個擴增子(amplicons),在保持高擴增均勻性的同時,顯著降低引物二聚體風險,為靶向測序進入“自動駕駛實驗室”時代奠定關鍵工程基礎。
這也是繼該團隊在Nature Machine Intelligence雜志上發(fā)表蛋白自博弈AI智能體后,時隔兩年再度發(fā)表AI相關文章。(Nature子刊!華大智造發(fā)布自博弈AI智能體,利用強化學習算法高效設計功能蛋白)?
在呼吸道流行季,公共衛(wèi)生實驗室面臨著與時間賽跑的挑戰(zhàn):需要快速識別流行毒株、追蹤傳播鏈并監(jiān)測耐藥性。要實現(xiàn)高效精準的檢測,關鍵在于為目標基因片段設計合適的引物——這相當于為檢測系統(tǒng)配制專屬“鑰匙”。引物與目標序列的關系如同鑰匙與鎖:必須精確匹配,確保只識別特定目標;同時還要在多重PCR反應中,與數(shù)百對引物協(xié)同工作而不相互干擾。
優(yōu)質的引物設計需要兼顧多重標準:特異性(不打到非目標位點)、退火溫度(Tm)匹配等,并盡量避開關鍵位點(如3′端錯配風險)。更大的挑戰(zhàn)在于多重PCR檢測:當反應體系中包含數(shù)百對引物時,每對引物既要保持自身的高效性,又要避免與其他引物產(chǎn)生干擾。隨著目標數(shù)增加,候選組合呈指數(shù)級膨脹,而面板中共有m條引物時,潛在引物二聚體/交叉二聚體的成對檢查負擔接近 O(m2)。再疊加基因組同源區(qū)、重復序列、樣本差異等因素,傳統(tǒng)的設計方法或單一工具往往需要多次調試,難以在高多重化場景下同時獲得高特異性、高均勻性、低二聚體的穩(wěn)健方案。
PrimeGen的使命,就是將這一“組合爆炸”的復雜問題,轉化為易于使用、可廣泛復用的工程化解決方案。系統(tǒng)采用輔助式設計嵌入實驗室工作流,研究人員只需用自然語言描述實驗目標,即可觸發(fā)一系列自動化流程,包括目標序列鎖定、候選引物與擴增子布局生成、實驗協(xié)議代碼塊(APB)組裝、液體處理機器人腳本生成、多視角視覺語言模型(VLM)質控、結果回寫與參數(shù)微調,最終形成完整的實驗閉環(huán),同時在關鍵決策節(jié)點仍由人工把控,確保安全性與可控性。
系統(tǒng)由四大智能體協(xié)同運作,各司其職(如圖1所示):
上游,搜索智能體與引物智能體協(xié)同完成目標序列定位和高通量引物布局,確保設計合理、特異性強;中段,協(xié)議智能體將設計結果轉化為可執(zhí)行的實驗協(xié)議代碼塊(APB,Assembly of Protocol Blocks),以統(tǒng)一策略生成可在不同平臺運行的實驗腳本,并高度適配多種多重擴增化學體系;下游,實驗智能體通過多視角視覺語言模型(VLM)實時監(jiān)測實驗關鍵步驟,識別潛在異常并記錄審計軌跡。得益于這一結構化架構,PrimeGen 即使在高達955個擴增子(amplicons)的超高通量條件下,仍能保持優(yōu)異的擴增均勻性,顯著降低引物二聚體風險,從而有效減少重復實驗次數(shù)、提升實驗穩(wěn)定性,并整體降低時間與成本開銷。系統(tǒng)運行周期的具體優(yōu)化幅度將根據(jù)任務規(guī)模、人工審校流程與實驗組織方式的不同而有所差異。
華大智造副總裁、論文通訊作者楊夢博士表示:“PrimeGen的突破驗證了將先進AI智能體與我們的自動化硬件平臺(如AlphaTool)深度融合的巨大潛力,也是華大智造實驗室智能自動化業(yè)務為科研人員賦能的優(yōu)秀范例。未來,我們將持續(xù)幫助客戶打通實驗室‘干實驗’與‘濕實驗’全鏈路,構建‘設計→執(zhí)行→優(yōu)化’的自進化閉環(huán)?!?/p>
01 Search Agent?搜索智能體?精準鎖定目標基因,生物領域的AI雷達
傳統(tǒng)的基因目標檢索需要科研人員耗時耗力地手動查閱數(shù)據(jù)庫。PrimeGen的搜索智能體能快速理解用戶需求,自動從NCBI等權威數(shù)據(jù)庫中檢索目標序列。無論是病原微生物、癌癥、耐藥性相關基因與位點,都能通過對話精準檢索,能夠涵蓋大多數(shù)高通量測序典型應用場景。
例如,在新冠病毒等流行病原檢測的測序任務中,它能快速提取靶標序列的保守區(qū)域;在遺傳病篩查場景中,它可以智能合并靶標序列的鄰近編碼區(qū),對引物設計進行整體考慮,避免引物沖突;面對模糊提問時,搜索智能體也能通過“ReAct”機制內部優(yōu)化檢索精度。同時提供人工介入機制(Human-in-the-loop)來保證序列檢索結果的可靠性,再將結果傳遞給引物設計環(huán)節(jié)。
02 Primer?Agent 引物設計智能體 最小化引物二聚體,優(yōu)化效率提升10倍
引物設計不僅要覆蓋目標區(qū)域,還需避免引物之間因錯誤結合而形成的二聚體。PrimeGen的引物設計智能體開創(chuàng)了“滑動窗口+LLM 迭代”的雙引擎機制:通過滑動窗口篩選引物并嚴格把控設計參數(shù),基于歷史記憶迭代的LLM優(yōu)化器進行引物優(yōu)化,將二聚體率壓到 <1%。
引物設計智能體在濕實驗反饋中,能夠實現(xiàn)自動微調參數(shù),無需人工反復調試。PrimeGen的高性能引物設計能力結合ATOPlex多重擴增技術,實現(xiàn)靶標區(qū)域的高效擴增。在新冠全基因組測序的應用中,對低拷貝數(shù)樣本實現(xiàn)≥99.8%基因組覆蓋(10×);在拓展性遺傳性疾病篩查(ECS)應用中, 針對22個復雜基因(包含高同源區(qū)域等),成功設計958重(958-plex)的擴增引物池,其產(chǎn)生的二聚體比率低至0.9%±0.3%,顯著領先行業(yè)內水平。
03 Protocol?Agent 實驗腳本設計智能體 實驗協(xié)議“一鍵生成”,儀器自動執(zhí)行
傳統(tǒng)實驗流程中,從引物設計到實驗操作,主要依賴人工來編寫繁瑣的設備運行腳本。
基于華大智造在多重PCR與建庫實驗中積累的大量高質量標準操作流程,以及移液工作站 AlphaTool開放 API 的可編程特性,PrimeGen 的實驗腳本設計智能體由此誕生,具備了自動化生成實驗流程的能力。
現(xiàn)在,實驗腳本設計智能體先通過兩步法,即任務拆解模式將建庫Kit說明書分解成多個子任務(sub-task)后,基于實驗邏輯通過檢索增強(RAG)技術組裝模塊化腳本(APB),產(chǎn)出可執(zhí)行的儀器腳本?,F(xiàn)有 28 個可調模塊(PCR、磁珠純化等),能自適應生成所有PCR任務的流程及其代碼。
04 Experiment?Agent 實驗執(zhí)行智能體 三只“眼睛”守護實驗,異常及時反饋修復
實驗過程中的移液錯誤、磁珠混合不均等問題常導致結果偏差。為此,PrimeGen引入搭載視覺語言模型(VLM)的實驗執(zhí)行智能體,通過三路攝像頭這“三只眼睛”來實時捕捉異常。VLM是一種能同時“看圖”和“理解語言”的人工智能技術,相比只能識別固定目標的傳統(tǒng)方法(如YOLO),它還能理解語境并生成解釋,更適合處理動態(tài)、多變的實驗異常。本方案三路攝像頭如下:
頂部攝像頭:監(jiān)控實驗布局,確保模塊位置正確。
移液臂攝像頭:檢測吸頭損壞、液體殘留等問題*。
底部攝像頭:分析磁珠混勻混合狀態(tài),自動調整參數(shù)后重試*。
標*項目為理論探索階段,非標準產(chǎn)品。
在自研的訓練模式下,Qwen2-VL-7B模型微調的多視角異常識別準確率達87%。例如,在磁珠純化步驟中,它能發(fā)現(xiàn)混合不充分的情況,并觸發(fā)自適應專家提示以調整流速,在嘗試修復異常的同時保障實驗穩(wěn)定性。
四體聯(lián)動=全流程無感智能
PrimeGen 作為智能化協(xié)同系統(tǒng)重構從“引物設計”到“實驗執(zhí)行”的端到端流程。
通過“搜索、設計、協(xié)議、實驗”四大智能體聯(lián)動,PrimeGen 注入自然語言交互與大模型能力,全面提升平臺智能化水平。其引物設計模塊優(yōu)化多重擴增體系,提升設計效率與實驗成功率;協(xié)議與執(zhí)行模塊則支持腳本自動生成和多模態(tài)反饋,增強流程穩(wěn)定性與自動化能力。
PrimeGen可無縫調度四大智能體,支持GPT-4o/Qwen/DeepSeek/GLM等國內外AI模型自由切換,適配不同算力環(huán)境。從樣本進來到報告產(chǎn)出,AI全程接管,從搜索、設計、代碼到實驗的全流程,干濕閉合,環(huán)環(huán)相扣,減少人工介入,真正實現(xiàn)「檢測方案個性化設計+實驗室流程智能執(zhí)行」!
未來,PrimeGen 將深度嵌入ATOPlex Fast產(chǎn)品體系,成為其智能驅動核心,進一步推動靶向測序向更高效、更自動化的方向演進。ATOPlex Fast首款靶向測序產(chǎn)品——ATOPlex Fast呼吸道合胞病毒A/B型(RSV A/B)全基因組建庫試劑盒將于8月上市。該產(chǎn)品采用RT-PCR單管擴增,4h完成建庫,覆蓋≥99.5%的RSV A/B型全基因組序列,并適配DNBSEQ、CycloneSEQ等市面上所有高通量及單分子測序平臺,助力靶向基因組研究全面進入8小時時代。
05 GLI—驅動實驗室智能進化
PrimeGen文章是一個很好的范例,展示了桌面級實驗室和可編程的實驗室管理系統(tǒng)為科研人員賦能,打通實驗室“干實驗”與“濕實驗”全鏈路,加速AI+生命科學的前沿研究。
華大智造今年推出的實驗室智能自動化GLI業(yè)務,標志著公司將AI技術全面融入生命科技工具領域。GLI業(yè)務對公司原有的”實驗室自動化業(yè)務”進行了智能技術升級,以先進的”實驗室智能自動化”工具和平臺為GBI(Generative Bio Intelligence,生成式生物智能)提供底層支撐,從”人工經(jīng)驗”向”數(shù)據(jù)驅動”決策的智能范式進化,旨在幫助傳統(tǒng)的實驗室自動化用戶突破數(shù)據(jù)-算法的互哺瓶頸,更快落地實驗室軟硬件和整體運行效果,加快發(fā)揮“AI+生命科學”的無限潛能。
從Lab as a Cube 到Lab as a factory,GLI賦能客戶建立干濕閉環(huán)的數(shù)據(jù)飛輪,幫助不同行業(yè)的實驗室用戶在短時間內快速具備平臺式可復用的“AI+”應用集成能力。
英偉達NVIDIA首席執(zhí)行官黃仁勛在今年COMPUTEX 2025大會上,將數(shù)據(jù)中心比喻為“智造AI的工廠”,指出人工智能正從“能聊天”邁向“能自主行動”的基礎設施;紅杉資本在4月發(fā)布的《AI 50·2025》報告亦強調,年度最大機遇在于智能體閉環(huán)貫通整條企業(yè)工作流。德勤預測,到2025年將有四分之一企業(yè)采用生成式 AI 部署智能體,至2027年這一比例有望翻倍,硅谷媒體已將此浪潮稱為“最后一公里自動化”。
華大智造正以 PrimeGen 多智能體系統(tǒng)為生命科學的這“最后一公里”開辟智能新范式——從基因檢索、引物設計到自動化實驗,全流程由 AI 協(xié)同完成,智能自動化GLI賦能生命科學智能革命,引領實驗室從自動化走向自主化。
AI智能體登Nature子刊!華大智造發(fā)布靶向測序引物設計工具PrimeGen
??點擊鏈接查看完整文章


本文系作者 @wzh 原創(chuàng)發(fā)布在 肽度TIMEDOO。未經(jīng)許可,禁止轉載。