雪鹰领主,有声读物,天蚕土豆

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求，分析“外掛式模型”演進(jìn)路徑下的操作系統(tǒng)發(fā)展困局，提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計來構(gòu)建模型原生操作系統(tǒng)，并進(jìn)一步探討了面臨的機(jī)遇與挑戰(zhàn)，以及業(yè)界與作者團(tuán)隊的相關(guān)初步探索。

以ChatGPT為代表的生成式人工智能（Generative AI）正在深刻變革人類社會。大模型憑借其卓越的語言理解、內(nèi)容生成與邏輯推理能力，已成為科技發(fā)展的新范式與重要推動力。全球主要經(jīng)濟(jì)體和科技巨頭紛紛布局，美國和歐盟累計投資上千億美元推進(jìn)技術(shù)研發(fā)，微軟、英偉達(dá)、蘋果、谷歌等公司在模型架構(gòu)、系統(tǒng)、芯片等方面展開全方位競爭。

然而，操作系統(tǒng)作為計算機(jī)系統(tǒng)的核心樞紐，其與人工智能技術(shù)的融合仍面臨諸多挑戰(zhàn)。當(dāng)前主流方案如微軟的Windows Copilot和蘋果的Apple Intelligence機(jī)制，采用將模型作為外掛服務(wù)的方式。這種方案雖然能快速落地，但模型的概率性特征、軟硬件棧的復(fù)雜性，以及模型-系統(tǒng)-芯片的割裂狀態(tài)等結(jié)構(gòu)性問題，導(dǎo)致當(dāng)前基于模型的智能應(yīng)用存在可控性差、開發(fā)難度大、算力效能低等短板，領(lǐng)域生態(tài)面臨“重作詩、輕做事”、生態(tài)碎片化、智能水平受限等問題。

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求，分析“外掛式”AI演進(jìn)路徑下的操作系統(tǒng)發(fā)展困局，提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計來構(gòu)建模型原生操作系統(tǒng)。這一新型操作系統(tǒng)將重構(gòu)交互范式、接口抽象、執(zhí)行模式、安全機(jī)制等，打通智能應(yīng)用間的數(shù)據(jù)壁壘，促進(jìn)多模型有機(jī)協(xié)同，優(yōu)化資源供給以提升運行效能，最終實現(xiàn)模型的概率性智能與操作系統(tǒng)的確定性規(guī)則的有機(jī)統(tǒng)一。本文將探討模型原生操作系統(tǒng)面臨的機(jī)遇與挑戰(zhàn)，并介紹業(yè)界與作者團(tuán)隊的相關(guān)初步探索。

人工智能時代操作系統(tǒng)的需求與挑戰(zhàn)

算法、數(shù)據(jù)、算力被譽為人工智能發(fā)展的三大引擎。操作系統(tǒng)的泛在性是連接和驅(qū)動這三大引擎的關(guān)鍵紐帶，是人工智能邁向通用智能、賦能千行百業(yè)的重要基石。從操作系統(tǒng)的視角來看，包括大模型、小模型、傳統(tǒng)機(jī)器學(xué)習(xí)方法等在內(nèi)的“模型”正在演變?yōu)橐环N底層基礎(chǔ)能力。人工智能時代的操作系統(tǒng)亟須實現(xiàn)對模型的原生支持，以滿足來自用戶、應(yīng)用及系統(tǒng)自身的智能化需求，在執(zhí)行效能、智力水平、交互范式、隱私保護(hù)與系統(tǒng)安全等方面實現(xiàn)變革。

執(zhí)行效能

隨著生成式人工智能的發(fā)展，模型參數(shù)規(guī)模呈指數(shù)級增長，對算力的需求也急劇攀升。為提供更強的算力支撐，GPU、NPU等新型算力硬件組成的異構(gòu)、混合精度算力系統(tǒng)已成為當(dāng)前人工智能場景的基礎(chǔ)設(shè)施，主流芯片設(shè)計廠商紛紛推出異構(gòu)算力芯片。異構(gòu)算力也促使虛擬數(shù)字人等新興應(yīng)用場景出現(xiàn)，該應(yīng)用往往需要GPU/NPU/CPU等多種計算硬件協(xié)同工作以支持虛擬數(shù)字人的實時交互和智能表現(xiàn)。在這一趨勢下，操作系統(tǒng)需要管理的資源從傳統(tǒng)的離散垂域分治轉(zhuǎn)向異構(gòu)融合架構(gòu)，這帶來了雙重挑戰(zhàn)：（1）異構(gòu)算力的融合使編程模型與框架日趨復(fù)雜，迫切需要操作系統(tǒng)向應(yīng)用提供統(tǒng)一、易用的編程抽象，以降低開發(fā)門檻；（2）不同硬件具有獨特的性能特質(zhì)和適用場景，如GPU、NPU適合大批量數(shù)據(jù)的高吞吐計算，CPU則更適合小規(guī)模數(shù)據(jù)的低延遲處理，這要求操作系統(tǒng)能夠智能規(guī)劃任務(wù)分配，實現(xiàn)異構(gòu)硬件的協(xié)同調(diào)度，最終提升系統(tǒng)整體執(zhí)行效能。

智力水平

大模型的迅猛發(fā)展正在重塑智能終端設(shè)備形態(tài)，有望賦能百億級參數(shù)的智能設(shè)備。全球領(lǐng)先的智能手機(jī)、個人電腦（PC）和汽車制造商正積極探索將大模型部署至移動設(shè)備和車載芯片上，以獲得更好的隱私保護(hù)和發(fā)揮本地化優(yōu)勢。谷歌推出的AI Core可在智能手機(jī)上運行擁有20億參數(shù)的Gemini Nano模型，蘋果計劃在iOS 18中整合30億參數(shù)的本地大模型，華為也通過鴻蒙原生智能將AI能力下沉到終端。面對這一趨勢，操作系統(tǒng)必須突破創(chuàng)新，使規(guī)模更大、智能水平更高的模型能夠在終端設(shè)備上高效運行。然而，現(xiàn)有的模型壓縮方法如量化、裁剪等往往導(dǎo)致模型性能顯著下降。這一技術(shù)瓶頸要求操作系統(tǒng)深入理解模型特性，探索更有針對性的優(yōu)化方案，而不能僅依靠簡單的壓縮、量化等手段。

交互范式

大模型正在引領(lǐng)人機(jī)交互范式的革命性轉(zhuǎn)變，將用戶從傳統(tǒng)的圖形界面演進(jìn)為語音、手勢、眼神等自然時空交互。很多行業(yè)正在積極探索這一新型交互形態(tài)，例如，OpenAI的GPT-4o支持實時語音對話，可充當(dāng)智能家教輔導(dǎo)作業(yè)；智譜AI的AutoGLM能夠理解并執(zhí)行復(fù)雜甚至跨APP的指令，包括“在線購物”“酒店預(yù)訂”甚至“發(fā)送紅包”等。可以預(yù)見，隨著數(shù)字化與智能化的深入，大模型將成為人機(jī)交互的重要入口，甚至能夠根據(jù)用戶習(xí)慣和場景動態(tài)調(diào)整交互界面。然而，當(dāng)前模型在理解用戶界面方面仍面臨諸多挑戰(zhàn)。例如，界面元素往往具有多樣的分辨率、比例和布局，并包含大量細(xì)粒度的文本、按鈕等交互對象，這些特點使現(xiàn)有模型難以準(zhǔn)確理解界面語義，制約了自然語言交互的效果。

隱私保護(hù)與系統(tǒng)安全

隨著大模型應(yīng)用的普及，其安全與隱私問題日益突出。近期歐洲數(shù)據(jù)保護(hù)委員會（EDPB）和意大利隱私監(jiān)管機(jī)構(gòu)對OpenAI服務(wù)進(jìn)行了嚴(yán)格審查，意大利甚至一度叫停ChatGPT。大模型的隱私保護(hù)涉及多個層面：（1）在數(shù)據(jù)層面，模型在訓(xùn)練和推理過程中可能泄露敏感信息，同時模型參數(shù)本身也是重要的數(shù)字資產(chǎn)；（2）在系統(tǒng)層面，復(fù)雜的軟硬件棧難免存在安全漏洞；（3）在行為層面，模型輸出的不確定性可能導(dǎo)致越權(quán)操作或偏離預(yù)期；（4）當(dāng)前系統(tǒng)過度關(guān)注性能指標(biāo)，缺乏系統(tǒng)化的行為審計與約束機(jī)制。這要求我們構(gòu)建多維度的安全防護(hù)體系，在數(shù)據(jù)、系統(tǒng)、行為、審計等層面實現(xiàn)全方位的隱私保護(hù)。

當(dāng)前“外掛式”AI演進(jìn)路徑的發(fā)展困局

以微軟Windows Copilot為代表的AI發(fā)展路徑以“外掛”形式在操作系統(tǒng)中提供智能化服務(wù)。Windows 11操作系統(tǒng)內(nèi)置了專門的Copilot窗口，支持用戶通過任務(wù)欄圖標(biāo)、快捷鍵或?qū)Ｓ冒存I等多種方式快速調(diào)用AI助手。Copilot不僅能夠進(jìn)行文本對話，還能執(zhí)行調(diào)整系統(tǒng)設(shè)置、輔助日常操作、給出寫作建議等多樣化任務(wù)。然而，這種將AI作為外掛式服務(wù)集成到現(xiàn)有操作系統(tǒng)的方案，雖然能夠快速落地并讓用戶體驗到智能服務(wù)，但從長遠(yuǎn)來看，存在算力差、智力差、魅力差、安全差四個方面的根本性困局，阻礙人工智能技術(shù)與操作系統(tǒng)的深度融合，影響為用戶提供更高水平的智能服務(wù)。

算力差：無法充分利用異構(gòu)硬件的計算能力

當(dāng)前算力硬件呈現(xiàn)快速迭代和多元化發(fā)展趨勢。一方面，主流GPU硬件不斷升級迭代；另一方面，各類AI芯片在提供特定算力優(yōu)化的同時，也在能耗、性價比等方面給予了更多選擇。智能手機(jī)、AI PC等端側(cè)場景更是普遍采用混合算力架構(gòu)，追求提升絕對計算能力的同時降低整體功耗。但在端側(cè)部署大模型時，其參數(shù)規(guī)模當(dāng)前停留在70億左右，大大限制了系統(tǒng)的智能水平。隨著智能化應(yīng)用的普及，算力硬件資源不再被少數(shù)應(yīng)用獨享，亟須操作系統(tǒng)對異構(gòu)化算力進(jìn)行統(tǒng)一、高效、協(xié)同的調(diào)度和管理，進(jìn)而將硬件的絕對計算能力兌現(xiàn)成應(yīng)用和系統(tǒng)的智力。外掛式智能服務(wù)面臨的困局在于，缺少操作系統(tǒng)的原生支持，無法有效利用和管理混合、異構(gòu)化算力資源，甚至可能造成算力資源的競爭與沖突。

智力差：智能化技術(shù)難以與操作系統(tǒng)深度融合

以外掛方式集成智能技術(shù)，僅能提供單向、有限的智能化支持，難以與操作系統(tǒng)各模塊深度融合，導(dǎo)致智能技術(shù)難以滲透到操作系統(tǒng)的關(guān)鍵服務(wù)和功能，限制了系統(tǒng)的智能化水平，阻礙其從“作詩”走向“做事”。外掛式智能技術(shù)難以利用操作系統(tǒng)的底層數(shù)據(jù)和資源，大大限制了其智力水平。例如，Windows Copilot無法直接訪問系統(tǒng)深層數(shù)據(jù)，未能與系統(tǒng)深度融合，且已被降級為漸進(jìn)式網(wǎng)絡(luò)應(yīng)用程序（PWA）。此外，外掛式智能技術(shù)存在數(shù)據(jù)孤島、響應(yīng)延遲高等問題，模型的概率性問題進(jìn)一步突顯，導(dǎo)致資源分配、任務(wù)調(diào)度及內(nèi)存管理等系統(tǒng)服務(wù)的智能化受到極大限制，難以實現(xiàn)深度系統(tǒng)級優(yōu)化。

魅力差：未能突破傳統(tǒng)操作系統(tǒng)固化的交互模式

傳統(tǒng)操作系統(tǒng)固化的交互邏輯難以滿足用戶群體的不同偏好，以及在不同場景下的交互需求。一方面，現(xiàn)有交互邏輯仍然是由開發(fā)者靜態(tài)設(shè)計，所有用戶體驗一份相同的交互邏輯，無法提供“千人千面”的個性化用戶體驗。另一方面，不同應(yīng)用的交互邏輯完全獨立，即便一個簡單的用戶任務(wù)也會涉及多個應(yīng)用，導(dǎo)致用戶必須在應(yīng)用之間反復(fù)切換。傳統(tǒng)操作系統(tǒng)固化的交互模式大大限制了智能技術(shù)融入人機(jī)交互過程。以蘋果公司Ferret-UI為例，其雖能利用多模態(tài)大模型操控用戶界面（UI）屏幕完成任務(wù)，但受限于固化交互模式，仍然被迫在多個應(yīng)用間頻繁切換與操作，單次任務(wù)包含冗長的操作與決策鏈條，導(dǎo)致任務(wù)完成率低、完成時間長、推理費用高等問題。

安全差：易導(dǎo)致系統(tǒng)安全隱患和隱私泄露問題

當(dāng)前智能技術(shù)本身存在不可解釋、不確定等安全隱患，而智能服務(wù)的執(zhí)行模式、交互方式等仍處于快速迭代發(fā)展中，其安全可靠性遠(yuǎn)低于操作系統(tǒng)。近年來，使用ChatGPT引發(fā)的機(jī)密泄露事件頻發(fā)，反映出大模型和智能服務(wù)面臨安全挑戰(zhàn)。以外掛形式集成智能服務(wù)，未將其納入到整個系統(tǒng)的安全保護(hù)機(jī)制中，可能引入安全漏洞并放大操作系統(tǒng)攻擊面，勢必影響系統(tǒng)的安全穩(wěn)定。如果允許外掛式智能服務(wù)直接訪問系統(tǒng)和處理數(shù)據(jù)，容易被利用成為攻擊入口和跳板。而如果單純將其隔離在外，智能服務(wù)使用的用戶數(shù)據(jù)又會面臨隱私泄露風(fēng)險。

上述困局本質(zhì)上源于外掛式智能服務(wù)方案未能實現(xiàn)AI與操作系統(tǒng)的有機(jī)融合，最終限制了整體的智能化水平。要真正發(fā)揮AI的潛力，需要在操作系統(tǒng)架構(gòu)層面進(jìn)行更深層次的變革。

破局思考：模型原生操作系統(tǒng)

模型作為一種底層基礎(chǔ)能力，在人工智能時代的操作系統(tǒng)演進(jìn)中必然扮演著重要角色，但操作系統(tǒng)以何種路徑與模型融合是一個重要且開放的問題。圖1對比了不同的發(fā)展路徑。圖1（a）為漸進(jìn)路線，即采用前文所提的將大模型作為應(yīng)用外掛到現(xiàn)有操作系統(tǒng)的方法，優(yōu)點是對現(xiàn)有操作系統(tǒng)改動少，可快速落地；缺點在于割裂模型與操作系統(tǒng)，制約了模型的能力。圖1（b）為激進(jìn)路線，即用大模型一次性取代操作系統(tǒng)成為新的操作系統(tǒng)，優(yōu)點在于可充分發(fā)揮大模型的智能能力；缺點在于完全顛覆現(xiàn)有軟件格局與生態(tài)，過于依賴模型本身的能力，缺乏與物理世界的交互能力，也缺乏對輸出的確定性保證。

圖1 智能時代操作系統(tǒng)與模型融合的不同發(fā)展路徑的系統(tǒng)架構(gòu)對比

與前兩種技術(shù)路線不同，我們提出采用融合路線探索模型原生操作系統(tǒng)，如圖1（c）所示。融合路線基于模型與操作系統(tǒng)雙向奔赴的思路，即系統(tǒng)原生為模型設(shè)計，模型原生為系統(tǒng)調(diào)整，通過在服務(wù)模型操控、供給模型資源、融合模型能力方面進(jìn)行探索，實現(xiàn)模型與操作系統(tǒng)的多層次深度融合。通過“模型-系統(tǒng)-芯片”全棧協(xié)同設(shè)計，重構(gòu)接口抽象、執(zhí)行模式、運行效能和安全機(jī)制等核心要素，實現(xiàn)概率性智能與確定性規(guī)則的有機(jī)統(tǒng)一，提升手機(jī)、PC、通用機(jī)器人、智能制造等領(lǐng)域的系統(tǒng)智能化水平，為用戶提供更加流暢、智能、個性化的服務(wù)。在此，我們將從六個維度闡述對模型原生操作系統(tǒng)的思考。

思考一：智能交互范式（面向交互范式革新）

大模型正在重塑操作系統(tǒng)與用戶的交互方式。傳統(tǒng)操作系統(tǒng)采用直接面向用戶的交互設(shè)計，用戶通過命令行、圖形界面、語音等接口操控硬件。在模型原生時代，用戶將更多地通過與智能體交互實現(xiàn)設(shè)備控制。然而，當(dāng)前操作系統(tǒng)的交互框架與智能體存在多重不匹配。在接口層面，現(xiàn)有框架主要依賴圖形界面表達(dá)功能語義，而大模型在UI理解的準(zhǔn)確性和確定性方面仍有明顯短板；在邏輯層面，傳統(tǒng)框架要求開發(fā)者靜態(tài)設(shè)計每個應(yīng)用的交互邏輯，難以支持大模型為用戶提供動態(tài)個性化的交互體驗；在能力層面，應(yīng)用間數(shù)據(jù)與功能的割裂狀態(tài)，阻礙了操作系統(tǒng)利用大模型實現(xiàn)跨應(yīng)用的智能服務(wù)。

為應(yīng)對這些挑戰(zhàn)，模型原生操作系統(tǒng)需要在多個層面進(jìn)行協(xié)同創(chuàng)新。在交互接口層面，設(shè)計面向模型的新型操作接口，使模型能夠準(zhǔn)確高效地調(diào)用系統(tǒng)功能；在交互邏輯層面，提供支持多模態(tài)的生成式交互邏輯開發(fā)框架，使開發(fā)者能夠利用大模型動態(tài)構(gòu)建時空自然交互；在交互能力層面，構(gòu)建“系統(tǒng)-模型-應(yīng)用”的數(shù)據(jù)互通機(jī)制，打通應(yīng)用間壁壘，支持基于上下文的智能交互。

思考二：創(chuàng)新系統(tǒng)抽象接口（面向提高執(zhí)行效能）

隨著模型與操作系統(tǒng)的融合，傳統(tǒng)操作系統(tǒng)的抽象面臨挑戰(zhàn)。現(xiàn)有接口針對命令式服務(wù)設(shè)計，難以滿足智能體的需求：（1）無法充分表達(dá)應(yīng)用語義或?qū)崿F(xiàn)端到端智能優(yōu)化；（2）缺乏原生智能化能力支持，增加了開發(fā)負(fù)擔(dān)，限制了智能體間的協(xié)作。同時，現(xiàn)有接口難以暴露底層系統(tǒng)服務(wù)和異構(gòu)硬件能力，導(dǎo)致性能損失。

為應(yīng)對這些挑戰(zhàn)，操作系統(tǒng)須引入智能化抽象，支持從單一命令到端到端需求的動態(tài)、靈活表達(dá)。在系統(tǒng)層面，支持多種層次的系統(tǒng)服務(wù)接口，高層接口滿足傳統(tǒng)應(yīng)用和程序使用，底層接口用于高性能智能應(yīng)用優(yōu)化，充分平衡智能的應(yīng)用和系統(tǒng)的實時性。同時，應(yīng)結(jié)合歷史行為和模型智能，利用生成式接口的新特性實現(xiàn)自我優(yōu)化與智能演進(jìn)。

思考三：系統(tǒng)內(nèi)生智能（面向提高智力水平）

當(dāng)前智能體的能力邊界局限于單個應(yīng)用范圍，各應(yīng)用通過外掛模型實現(xiàn)智能化。例如，用戶期望智能體能自動完成日程安排，這需要跨越日歷、會議、郵件等多個應(yīng)用實現(xiàn)協(xié)同。然而，目前面向特定領(lǐng)域的專用模型在適應(yīng)性和魯棒性方面存在明顯不足。典型案例是當(dāng)前的手機(jī)智能助手，雖然能夠執(zhí)行簡單的購物任務(wù)，但一旦遇到未經(jīng)訓(xùn)練的廣告彈窗等干擾就極易中斷操作。

為此，模型原生操作系統(tǒng)應(yīng)具備內(nèi)生智能，從而有機(jī)整合來自不同應(yīng)用智能體的能力，實現(xiàn)跨應(yīng)用的無縫配合與復(fù)雜協(xié)同。這就需要構(gòu)建面向操作系統(tǒng)的通用基礎(chǔ)模型，提供系統(tǒng)級智能體服務(wù)，并實現(xiàn)模型能力與系統(tǒng)功能的深度融合，支持跨應(yīng)用的無縫協(xié)作；同時，建立高效的持續(xù)學(xué)習(xí)機(jī)制，探索新的操作系統(tǒng)內(nèi)生智能的訓(xùn)練方法，并實現(xiàn)高效、低成本的持續(xù)訓(xùn)練和微調(diào)，以更好地滿足用戶多樣化的智能需求。

思考四：智能知識存儲（面向提高智力水平）

模型智能水平與知識型數(shù)據(jù)緊密相關(guān)，現(xiàn)有存儲系統(tǒng)主要面向數(shù)據(jù)而非知識，難以滿足大模型對知識生成、管理和利用的需求。在縱向維度，現(xiàn)有系統(tǒng)在設(shè)計上強調(diào)對原始數(shù)據(jù)的存取，缺乏對數(shù)據(jù)語義層次和知識表示的高效支持；在橫向維度，模型應(yīng)用模糊化的輸入使多模態(tài)、多類型的存儲系統(tǒng)關(guān)聯(lián)更加緊密，而異構(gòu)表達(dá)形式給數(shù)據(jù)跨應(yīng)用橫向流動帶來挑戰(zhàn)。

為應(yīng)對這些挑戰(zhàn)，在縱向?qū)用妫到y(tǒng)須面向知識存儲最大程度地利用軟硬協(xié)同的通信機(jī)制，提供與硬件演進(jìn)協(xié)同發(fā)展的編程抽象；在橫向?qū)用妫到y(tǒng)應(yīng)通過更高整合度的數(shù)據(jù)結(jié)構(gòu)與通信機(jī)制，實現(xiàn)不同存儲系統(tǒng)數(shù)據(jù)互通與協(xié)作，為模型提供跨應(yīng)用的數(shù)據(jù)融合能力，使多模態(tài)等任務(wù)中的數(shù)據(jù)協(xié)同更加高效，從而提升模型在復(fù)雜場景下的智能水平。

思考五：高效算力供給（面向提高執(zhí)行效能）

模型對算力有著極高的要求。然而，模型原生操作系統(tǒng)在為模型提供算力時，不能僅考慮模型本身的需求，還要綜合考慮算力、內(nèi)存、功耗、智能水平等多個相互制衡的關(guān)鍵指標(biāo)。當(dāng)前異構(gòu)算力硬件體系為智能應(yīng)用提供了關(guān)鍵性的算力支撐，但當(dāng)前操作系統(tǒng)仍然以特殊外設(shè)的方式管理算力硬件，智能應(yīng)用主要依賴專門化適配與設(shè)計來利用特定的算力硬件，導(dǎo)致系統(tǒng)嚴(yán)重碎片化，也大大限制了智能應(yīng)用的發(fā)展和普及。

為應(yīng)對這些挑戰(zhàn)，需要在多個層面實施優(yōu)化策略。在模型層面，研究如何在保持模型性能的同時減少參數(shù)量；探索動態(tài)調(diào)整模型結(jié)構(gòu)的方法，并針對智能體等復(fù)雜場景提出針對性的模型微調(diào)和輕量化設(shè)計。在系統(tǒng)層面，探索端側(cè)資源受限場景下的高效推理方案，包括面向操作系統(tǒng)目標(biāo)任務(wù)的模型稀疏化、投機(jī)推理等；同時設(shè)計新的計算卸載方案，在保證用戶數(shù)據(jù)隱私以及對應(yīng)用盡可能透明的前提下，充分利用來自富算力設(shè)備的計算資源。在硬件層面，探索異構(gòu)計算架構(gòu)，針對不同類型任務(wù)提供專用處理單元并實現(xiàn)協(xié)同調(diào)度和統(tǒng)一管理，提高整體效率。

思考六：系統(tǒng)安全可靠（面向隱私保護(hù)與系統(tǒng)安全）

隨著大模型系統(tǒng)應(yīng)用越來越廣泛，其在隱私安全與可靠性方面的挑戰(zhàn)也越來越突出。在數(shù)據(jù)隱私方面，一方面大模型在訪問和生成數(shù)據(jù)時，可能會泄露隱私數(shù)據(jù)和敏感信息；另一方面，大模型自身的參數(shù)也是需要保護(hù)的重要數(shù)字資產(chǎn)。在可靠性層面，大模型的輸出存在不確定性，可能導(dǎo)致模型執(zhí)行未經(jīng)授權(quán)的操作或出現(xiàn)偏離預(yù)期的行為；目前的系統(tǒng)往往注重性能和精度等指標(biāo)的提升，缺乏有效的行為審計機(jī)制和約束技術(shù)。

為應(yīng)對這些挑戰(zhàn)，在數(shù)據(jù)安全方面，應(yīng)對大模型的參數(shù)和數(shù)據(jù)進(jìn)行“存儲-傳輸-計算”的全生命周期加密保護(hù)，嚴(yán)格控制數(shù)據(jù)流轉(zhuǎn)時的訪問權(quán)限，并構(gòu)建輕量化、定制化的可信AI軟件棧，減少攻擊面以提高系統(tǒng)的整體安全性；在可靠性方面，提出面向智能應(yīng)用安全的內(nèi)生安全審計機(jī)制，通過彈性規(guī)則對模型的行為進(jìn)行動態(tài)約束，在保證模型智能水平的同時有效提升確定性。

當(dāng)前探索與實踐

模型原生操作系統(tǒng)作為一種新興的技術(shù)范式，正在成為人工智能大模型從“作詩”走向“做事”的關(guān)鍵。雖然目前尚未出現(xiàn)完全實現(xiàn)這一設(shè)計理念的成熟產(chǎn)品，但國內(nèi)外學(xué)術(shù)界和工業(yè)界已經(jīng)開展了這方面的初步探索。

OpenAI聯(lián)合創(chuàng)始人安德烈·卡帕西(Andrej Karpathy)在2023年11月提出了LLM OS理念，激進(jìn)地用大語言模型替代操作系統(tǒng)(LLM as OS)。美國羅格斯大學(xué)提出的AIOS是LLM OS理念的一次初步實踐。然而，這類探索主要存在兩個局限：一是提出了全新的交互范式和軟件開發(fā)模式，難以有效兼容現(xiàn)有軟件生態(tài)；二是將模型作為黑盒使用，并未針對模型的推理效能、智力水平等進(jìn)行針對性地優(yōu)化。作為一種折衷方案，SWE-agent提出了智能體-計算機(jī)接口(Agent-Computer Interface, ACI)，將大模型智能體在軟件工程任務(wù)中能夠解決的問題從3.8%提升至18%，驗證了操作系統(tǒng)與大模型協(xié)同的重要性。

除了系統(tǒng)架構(gòu)和編程接口層面的創(chuàng)新，工業(yè)界正在積極探索操作系統(tǒng)智能體技術(shù)。美國Anthropic公司的Computer Use和國內(nèi)智譜公司的AutoGLM等系統(tǒng)通過將云端大模型與圖形界面（GUI）深度融合，實現(xiàn)了智能化的界面操作自動化，在辦公應(yīng)用、社交媒體、在線購物等場景展現(xiàn)出接近人類水平的操作能力。然而，當(dāng)前基于外掛式多模態(tài)大模型的方案在處理動態(tài)UI和復(fù)雜操作時仍面臨挑戰(zhàn)。同時，依賴云端大模型帶來的網(wǎng)絡(luò)延遲和隱私安全問題也亟待解決。

為了支持大模型在端側(cè)設(shè)備中的推理，當(dāng)前業(yè)界提出了多種端側(cè)大模型推理框架，如ExecuTorch、llama.cpp和MLC LLM等，然而這些系統(tǒng)對異構(gòu)算力的利用有限，端側(cè)設(shè)備通常只能運行不超過100億參數(shù)的小型模型，制約了模型原生操作系統(tǒng)的性能水平。為解決這一問題，上海交通大學(xué)推出PowerInfer系列工作，首次探索“模型-系統(tǒng)-芯片”協(xié)同設(shè)計理念，實現(xiàn)端側(cè)大模型的顯著加速。該方案在模型層面采用Turbo Sparse方法提升模型稀疏性，在系統(tǒng)和芯片層面優(yōu)化操作系統(tǒng)推理設(shè)計，實現(xiàn)異構(gòu)算力調(diào)度、神經(jīng)元簇流水線等技術(shù)。實驗結(jié)果表明，PowerInfer-1在個人電腦上實現(xiàn)11.7倍加速，可運行1750億參數(shù)模型；PowerInfer-2讓智能手機(jī)流暢運行470億參數(shù)模型，性能提升27.8倍。

模型原生操作系統(tǒng)除了需要解決端側(cè)推理性能問題，還需要解決智能應(yīng)用在硬件加速器層面的高效調(diào)度問題。當(dāng)前商用GPU缺乏有效的搶占式調(diào)度機(jī)制，實時任務(wù)面臨兩難選擇：要么獨占GPU資源，增加成本；要么等待低優(yōu)先級任務(wù)完成，影響性能。上海交通大學(xué)團(tuán)隊最早在商用GPU上實現(xiàn)了百微秒內(nèi)的任務(wù)搶占和細(xì)粒度的空分算力共享，與將GPU專用于實時任務(wù)相比，整體吞吐能力提升7.7倍，與多任務(wù)共享GPU相比，時延干擾減少99%。當(dāng)前硬件加速器百家爭鳴，系統(tǒng)層面的支持成為競爭關(guān)鍵，團(tuán)隊進(jìn)一步提出了硬件加速器調(diào)度的通用抽象和多層硬件模型，能夠快速支持不同架構(gòu)、品牌、代次硬件加速器的搶占式調(diào)度，以及開發(fā)硬件無關(guān)的通用調(diào)度策略。

結(jié)束語

模型原生操作系統(tǒng)是人工智能時代操作系統(tǒng)的重要發(fā)展方向，需要在模型與系統(tǒng)的深度融合中探索理論創(chuàng)新。這種融合不是簡單的功能疊加，而是要從架構(gòu)到實現(xiàn)進(jìn)行全方位創(chuàng)新，從而推動操作系統(tǒng)的智能化演進(jìn)。雖然學(xué)術(shù)界和產(chǎn)業(yè)界在架構(gòu)設(shè)計、性能優(yōu)化、調(diào)度機(jī)制等方面取得了一系列初步探索，但要實現(xiàn)真正可用的產(chǎn)品級系統(tǒng)，仍須在交互范式革新、模型推理效能、系統(tǒng)融合程度、生態(tài)演進(jìn)策略等方面持續(xù)深入研究。

（本文內(nèi)容是基于2024中國計算機(jī)大會（CNCC2024）“大模型基礎(chǔ)軟件”論壇上的報告《模型原生操作系統(tǒng)的一些思考》進(jìn)行的擴(kuò)展）

掃碼觀看相關(guān)視頻

陳海波

CCF會士、系統(tǒng)軟件專委會副主任、開源發(fā)展委員會常務(wù)委員。上海交通大學(xué)特聘教授，ACM/IEEE Fellow。主要研究方向為操作系統(tǒng)、分布式系統(tǒng)和機(jī)器學(xué)習(xí)系統(tǒng)等。haibochen@sjtu.edu.cn

夏虞斌

CCF杰出會員、系統(tǒng)軟件專委會常務(wù)委員、開源發(fā)展委員會執(zhí)行委員、教育工委主任助理。上海交通大學(xué)教授。主要研究方向為操作系統(tǒng)、體系結(jié)構(gòu)等。xiayubin@sjtu.edu.cn

陳榕

CCF杰出會員、CCCF專欄編委。上海交通大學(xué)教授。主要研究方向為操作系統(tǒng)、分布式系統(tǒng)、智能計算系統(tǒng)等。rongchen@sjtu.edu.cn

其他作者：王肇國糜澤羽古金宇

CCF推薦

【精品文章】

泛在操作系統(tǒng)：研究與實踐 | CCCF精選

分布式系統(tǒng)與可信計算的探索之路——專訪“CCF 海外科技人物獎”獲得者徐潔 | CCCF精選

梅宏：擁抱泛在計算 | CCCF精選

審核編輯黃宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴