在线观看www成人影院-在线观看www日本免费网站-在线观看www视频-在线观看操-欧美18在线-欧美1级

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

模型原生操作系統(tǒng):機(jī)遇、挑戰(zhàn)與展望 CCCF精選

OpenHarmony TSC ? 來源:OpenHarmony TSC ? 作者:OpenHarmony TSC ? 2025-03-14 17:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求,分析“外掛式模型”演進(jìn)路徑下的操作系統(tǒng)發(fā)展困局,提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計來構(gòu)建模型原生操作系統(tǒng),并進(jìn)一步探討了面臨的機(jī)遇與挑戰(zhàn),以及業(yè)界與作者團(tuán)隊的相關(guān)初步探索。

wKgZO2fT-8mAOUpTAAC-Z-xLPOs337.png

以ChatGPT為代表的生成式人工智能(Generative AI)正在深刻變革人類社會。大模型憑借其卓越的語言理解、內(nèi)容生成與邏輯推理能力,已成為科技發(fā)展的新范式與重要推動力。全球主要經(jīng)濟(jì)體和科技巨頭紛紛布局,美國和歐盟累計投資上千億美元推進(jìn)技術(shù)研發(fā),微軟、英偉達(dá)、蘋果、谷歌等公司在模型架構(gòu)、系統(tǒng)、芯片等方面展開全方位競爭。

然而,操作系統(tǒng)作為計算機(jī)系統(tǒng)的核心樞紐,其與人工智能技術(shù)的融合仍面臨諸多挑戰(zhàn)。當(dāng)前主流方案如微軟的Windows Copilot和蘋果的Apple Intelligence機(jī)制,采用將模型作為外掛服務(wù)的方式。這種方案雖然能快速落地,但模型的概率性特征、軟硬件棧的復(fù)雜性,以及模型-系統(tǒng)-芯片的割裂狀態(tài)等結(jié)構(gòu)性問題,導(dǎo)致當(dāng)前基于模型的智能應(yīng)用存在可控性差、開發(fā)難度大、算力效能低等短板,領(lǐng)域生態(tài)面臨“重作詩、輕做事”、生態(tài)碎片化、智能水平受限等問題。

本文立足人工智能時代用戶、應(yīng)用和系統(tǒng)的需求,分析“外掛式”AI演進(jìn)路徑下的操作系統(tǒng)發(fā)展困局,提出通過“模型-系統(tǒng)-芯片”的全棧協(xié)同設(shè)計來構(gòu)建模型原生操作系統(tǒng)。這一新型操作系統(tǒng)將重構(gòu)交互范式、接口抽象、執(zhí)行模式、安全機(jī)制等,打通智能應(yīng)用間的數(shù)據(jù)壁壘,促進(jìn)多模型有機(jī)協(xié)同,優(yōu)化資源供給以提升運行效能,最終實現(xiàn)模型的概率性智能與操作系統(tǒng)的確定性規(guī)則的有機(jī)統(tǒng)一。本文將探討模型原生操作系統(tǒng)面臨的機(jī)遇與挑戰(zhàn),并介紹業(yè)界與作者團(tuán)隊的相關(guān)初步探索。

人工智能時代操作系統(tǒng)的需求與挑戰(zhàn)

算法、數(shù)據(jù)、算力被譽為人工智能發(fā)展的三大引擎。操作系統(tǒng)的泛在性是連接和驅(qū)動這三大引擎的關(guān)鍵紐帶,是人工智能邁向通用智能、賦能千行百業(yè)的重要基石。從操作系統(tǒng)的視角來看,包括大模型、小模型、傳統(tǒng)機(jī)器學(xué)習(xí)方法等在內(nèi)的“模型”正在演變?yōu)橐环N底層基礎(chǔ)能力。人工智能時代的操作系統(tǒng)亟須實現(xiàn)對模型的原生支持,以滿足來自用戶、應(yīng)用及系統(tǒng)自身的智能化需求,在執(zhí)行效能、智力水平、交互范式、隱私保護(hù)與系統(tǒng)安全等方面實現(xiàn)變革。

執(zhí)行效能

隨著生成式人工智能的發(fā)展,模型參數(shù)規(guī)模呈指數(shù)級增長,對算力的需求也急劇攀升。為提供更強的算力支撐,GPU、NPU等新型算力硬件組成的異構(gòu)、混合精度算力系統(tǒng)已成為當(dāng)前人工智能場景的基礎(chǔ)設(shè)施,主流芯片設(shè)計廠商紛紛推出異構(gòu)算力芯片。異構(gòu)算力也促使虛擬數(shù)字人等新興應(yīng)用場景出現(xiàn),該應(yīng)用往往需要GPU/NPU/CPU等多種計算硬件協(xié)同工作以支持虛擬數(shù)字人的實時交互和智能表現(xiàn)。在這一趨勢下,操作系統(tǒng)需要管理的資源從傳統(tǒng)的離散垂域分治轉(zhuǎn)向異構(gòu)融合架構(gòu),這帶來了雙重挑戰(zhàn):(1)異構(gòu)算力的融合使編程模型與框架日趨復(fù)雜,迫切需要操作系統(tǒng)向應(yīng)用提供統(tǒng)一、易用的編程抽象,以降低開發(fā)門檻;(2)不同硬件具有獨特的性能特質(zhì)和適用場景,如GPU、NPU適合大批量數(shù)據(jù)的高吞吐計算,CPU則更適合小規(guī)模數(shù)據(jù)的低延遲處理,這要求操作系統(tǒng)能夠智能規(guī)劃任務(wù)分配,實現(xiàn)異構(gòu)硬件的協(xié)同調(diào)度,最終提升系統(tǒng)整體執(zhí)行效能。

智力水平

大模型的迅猛發(fā)展正在重塑智能終端設(shè)備形態(tài),有望賦能百億級參數(shù)的智能設(shè)備。全球領(lǐng)先的智能手機(jī)、個人電腦(PC)和汽車制造商正積極探索將大模型部署至移動設(shè)備和車載芯片上,以獲得更好的隱私保護(hù)和發(fā)揮本地化優(yōu)勢。谷歌推出的AI Core可在智能手機(jī)上運行擁有20億參數(shù)的Gemini Nano模型,蘋果計劃在iOS 18中整合30億參數(shù)的本地大模型,華為也通過鴻蒙原生智能將AI能力下沉到終端。面對這一趨勢,操作系統(tǒng)必須突破創(chuàng)新,使規(guī)模更大、智能水平更高的模型能夠在終端設(shè)備上高效運行。然而,現(xiàn)有的模型壓縮方法如量化、裁剪等往往導(dǎo)致模型性能顯著下降。這一技術(shù)瓶頸要求操作系統(tǒng)深入理解模型特性,探索更有針對性的優(yōu)化方案,而不能僅依靠簡單的壓縮、量化等手段。

交互范式

大模型正在引領(lǐng)人機(jī)交互范式的革命性轉(zhuǎn)變,將用戶從傳統(tǒng)的圖形界面演進(jìn)為語音、手勢、眼神等自然時空交互。很多行業(yè)正在積極探索這一新型交互形態(tài),例如,OpenAI的GPT-4o支持實時語音對話,可充當(dāng)智能家教輔導(dǎo)作業(yè);智譜AI的AutoGLM能夠理解并執(zhí)行復(fù)雜甚至跨APP的指令,包括“在線購物”“酒店預(yù)訂”甚至“發(fā)送紅包”等。可以預(yù)見,隨著數(shù)字化與智能化的深入,大模型將成為人機(jī)交互的重要入口,甚至能夠根據(jù)用戶習(xí)慣和場景動態(tài)調(diào)整交互界面。然而,當(dāng)前模型在理解用戶界面方面仍面臨諸多挑戰(zhàn)。例如,界面元素往往具有多樣的分辨率、比例和布局,并包含大量細(xì)粒度的文本、按鈕等交互對象,這些特點使現(xiàn)有模型難以準(zhǔn)確理解界面語義,制約了自然語言交互的效果。

隱私保護(hù)與系統(tǒng)安全

隨著大模型應(yīng)用的普及,其安全與隱私問題日益突出。近期歐洲數(shù)據(jù)保護(hù)委員會(EDPB)和意大利隱私監(jiān)管機(jī)構(gòu)對OpenAI服務(wù)進(jìn)行了嚴(yán)格審查,意大利甚至一度叫停ChatGPT。大模型的隱私保護(hù)涉及多個層面:(1)在數(shù)據(jù)層面,模型在訓(xùn)練和推理過程中可能泄露敏感信息,同時模型參數(shù)本身也是重要的數(shù)字資產(chǎn);(2)在系統(tǒng)層面,復(fù)雜的軟硬件棧難免存在安全漏洞;(3)在行為層面,模型輸出的不確定性可能導(dǎo)致越權(quán)操作或偏離預(yù)期;(4)當(dāng)前系統(tǒng)過度關(guān)注性能指標(biāo),缺乏系統(tǒng)化的行為審計與約束機(jī)制。這要求我們構(gòu)建多維度的安全防護(hù)體系,在數(shù)據(jù)、系統(tǒng)、行為、審計等層面實現(xiàn)全方位的隱私保護(hù)。

當(dāng)前“外掛式”AI演進(jìn)路徑的發(fā)展困局

以微軟Windows Copilot為代表的AI發(fā)展路徑以“外掛”形式在操作系統(tǒng)中提供智能化服務(wù)。Windows 11操作系統(tǒng)內(nèi)置了專門的Copilot窗口,支持用戶通過任務(wù)欄圖標(biāo)、快捷鍵或?qū)S冒存I等多種方式快速調(diào)用AI助手。Copilot不僅能夠進(jìn)行文本對話,還能執(zhí)行調(diào)整系統(tǒng)設(shè)置、輔助日常操作、給出寫作建議等多樣化任務(wù)。然而,這種將AI作為外掛式服務(wù)集成到現(xiàn)有操作系統(tǒng)的方案,雖然能夠快速落地并讓用戶體驗到智能服務(wù),但從長遠(yuǎn)來看,存在算力差、智力差、魅力差、安全差四個方面的根本性困局,阻礙人工智能技術(shù)與操作系統(tǒng)的深度融合,影響為用戶提供更高水平的智能服務(wù)。

算力差:無法充分利用異構(gòu)硬件的計算能力

當(dāng)前算力硬件呈現(xiàn)快速迭代和多元化發(fā)展趨勢。一方面,主流GPU硬件不斷升級迭代;另一方面,各類AI芯片在提供特定算力優(yōu)化的同時,也在能耗、性價比等方面給予了更多選擇。智能手機(jī)、AI PC等端側(cè)場景更是普遍采用混合算力架構(gòu),追求提升絕對計算能力的同時降低整體功耗。但在端側(cè)部署大模型時,其參數(shù)規(guī)模當(dāng)前停留在70億左右,大大限制了系統(tǒng)的智能水平。隨著智能化應(yīng)用的普及,算力硬件資源不再被少數(shù)應(yīng)用獨享,亟須操作系統(tǒng)對異構(gòu)化算力進(jìn)行統(tǒng)一、高效、協(xié)同的調(diào)度和管理,進(jìn)而將硬件的絕對計算能力兌現(xiàn)成應(yīng)用和系統(tǒng)的智力。外掛式智能服務(wù)面臨的困局在于,缺少操作系統(tǒng)的原生支持,無法有效利用和管理混合、異構(gòu)化算力資源,甚至可能造成算力資源的競爭與沖突。

智力差:智能化技術(shù)難以與操作系統(tǒng)深度融合

以外掛方式集成智能技術(shù),僅能提供單向、有限的智能化支持,難以與操作系統(tǒng)各模塊深度融合,導(dǎo)致智能技術(shù)難以滲透到操作系統(tǒng)的關(guān)鍵服務(wù)和功能,限制了系統(tǒng)的智能化水平,阻礙其從“作詩”走向“做事”。外掛式智能技術(shù)難以利用操作系統(tǒng)的底層數(shù)據(jù)和資源,大大限制了其智力水平。例如,Windows Copilot無法直接訪問系統(tǒng)深層數(shù)據(jù),未能與系統(tǒng)深度融合,且已被降級為漸進(jìn)式網(wǎng)絡(luò)應(yīng)用程序(PWA)。此外,外掛式智能技術(shù)存在數(shù)據(jù)孤島、響應(yīng)延遲高等問題,模型的概率性問題進(jìn)一步突顯,導(dǎo)致資源分配、任務(wù)調(diào)度及內(nèi)存管理等系統(tǒng)服務(wù)的智能化受到極大限制,難以實現(xiàn)深度系統(tǒng)級優(yōu)化。

魅力差:未能突破傳統(tǒng)操作系統(tǒng)固化的交互模式

傳統(tǒng)操作系統(tǒng)固化的交互邏輯難以滿足用戶群體的不同偏好,以及在不同場景下的交互需求。一方面,現(xiàn)有交互邏輯仍然是由開發(fā)者靜態(tài)設(shè)計,所有用戶體驗一份相同的交互邏輯,無法提供“千人千面”的個性化用戶體驗。另一方面,不同應(yīng)用的交互邏輯完全獨立,即便一個簡單的用戶任務(wù)也會涉及多個應(yīng)用,導(dǎo)致用戶必須在應(yīng)用之間反復(fù)切換。傳統(tǒng)操作系統(tǒng)固化的交互模式大大限制了智能技術(shù)融入人機(jī)交互過程。以蘋果公司Ferret-UI為例,其雖能利用多模態(tài)大模型操控用戶界面(UI)屏幕完成任務(wù),但受限于固化交互模式,仍然被迫在多個應(yīng)用間頻繁切換與操作,單次任務(wù)包含冗長的操作與決策鏈條,導(dǎo)致任務(wù)完成率低、完成時間長、推理費用高等問題。

安全差:易導(dǎo)致系統(tǒng)安全隱患和隱私泄露問題

當(dāng)前智能技術(shù)本身存在不可解釋、不確定等安全隱患,而智能服務(wù)的執(zhí)行模式、交互方式等仍處于快速迭代發(fā)展中,其安全可靠性遠(yuǎn)低于操作系統(tǒng)。近年來,使用ChatGPT引發(fā)的機(jī)密泄露事件頻發(fā),反映出大模型和智能服務(wù)面臨安全挑戰(zhàn)。以外掛形式集成智能服務(wù),未將其納入到整個系統(tǒng)的安全保護(hù)機(jī)制中,可能引入安全漏洞并放大操作系統(tǒng)攻擊面,勢必影響系統(tǒng)的安全穩(wěn)定。如果允許外掛式智能服務(wù)直接訪問系統(tǒng)和處理數(shù)據(jù),容易被利用成為攻擊入口和跳板。而如果單純將其隔離在外,智能服務(wù)使用的用戶數(shù)據(jù)又會面臨隱私泄露風(fēng)險。

上述困局本質(zhì)上源于外掛式智能服務(wù)方案未能實現(xiàn)AI與操作系統(tǒng)的有機(jī)融合,最終限制了整體的智能化水平。要真正發(fā)揮AI的潛力,需要在操作系統(tǒng)架構(gòu)層面進(jìn)行更深層次的變革。

破局思考:模型原生操作系統(tǒng)

模型作為一種底層基礎(chǔ)能力,在人工智能時代的操作系統(tǒng)演進(jìn)中必然扮演著重要角色,但操作系統(tǒng)以何種路徑與模型融合是一個重要且開放的問題。圖1對比了不同的發(fā)展路徑。圖1(a)為漸進(jìn)路線,即采用前文所提的將大模型作為應(yīng)用外掛到現(xiàn)有操作系統(tǒng)的方法,優(yōu)點是對現(xiàn)有操作系統(tǒng)改動少,可快速落地;缺點在于割裂模型與操作系統(tǒng),制約了模型的能力。圖1(b)為激進(jìn)路線,即用大模型一次性取代操作系統(tǒng)成為新的操作系統(tǒng),優(yōu)點在于可充分發(fā)揮大模型的智能能力;缺點在于完全顛覆現(xiàn)有軟件格局與生態(tài),過于依賴模型本身的能力,缺乏與物理世界的交互能力,也缺乏對輸出的確定性保證。

wKgZO2fT-8qAH-e6AANJXrmuPAk848.png

圖1 智能時代操作系統(tǒng)與模型融合的不同發(fā)展路徑的系統(tǒng)架構(gòu)對比

與前兩種技術(shù)路線不同,我們提出采用融合路線探索模型原生操作系統(tǒng),如圖1(c)所示。融合路線基于模型與操作系統(tǒng)雙向奔赴的思路,即系統(tǒng)原生為模型設(shè)計,模型原生為系統(tǒng)調(diào)整,通過在服務(wù)模型操控、供給模型資源、融合模型能力方面進(jìn)行探索,實現(xiàn)模型與操作系統(tǒng)的多層次深度融合。通過“模型-系統(tǒng)-芯片”全棧協(xié)同設(shè)計,重構(gòu)接口抽象、執(zhí)行模式、運行效能和安全機(jī)制等核心要素,實現(xiàn)概率性智能與確定性規(guī)則的有機(jī)統(tǒng)一,提升手機(jī)、PC、通用機(jī)器人、智能制造等領(lǐng)域的系統(tǒng)智能化水平,為用戶提供更加流暢、智能、個性化的服務(wù)。在此,我們將從六個維度闡述對模型原生操作系統(tǒng)的思考。

思考一:智能交互范式(面向交互范式革新)

大模型正在重塑操作系統(tǒng)與用戶的交互方式。傳統(tǒng)操作系統(tǒng)采用直接面向用戶的交互設(shè)計,用戶通過命令行、圖形界面、語音等接口操控硬件。在模型原生時代,用戶將更多地通過與智能體交互實現(xiàn)設(shè)備控制。然而,當(dāng)前操作系統(tǒng)的交互框架與智能體存在多重不匹配。在接口層面,現(xiàn)有框架主要依賴圖形界面表達(dá)功能語義,而大模型在UI理解的準(zhǔn)確性和確定性方面仍有明顯短板;在邏輯層面,傳統(tǒng)框架要求開發(fā)者靜態(tài)設(shè)計每個應(yīng)用的交互邏輯,難以支持大模型為用戶提供動態(tài)個性化的交互體驗;在能力層面,應(yīng)用間數(shù)據(jù)與功能的割裂狀態(tài),阻礙了操作系統(tǒng)利用大模型實現(xiàn)跨應(yīng)用的智能服務(wù)。

為應(yīng)對這些挑戰(zhàn),模型原生操作系統(tǒng)需要在多個層面進(jìn)行協(xié)同創(chuàng)新。在交互接口層面,設(shè)計面向模型的新型操作接口,使模型能夠準(zhǔn)確高效地調(diào)用系統(tǒng)功能;在交互邏輯層面,提供支持多模態(tài)的生成式交互邏輯開發(fā)框架,使開發(fā)者能夠利用大模型動態(tài)構(gòu)建時空自然交互;在交互能力層面,構(gòu)建“系統(tǒng)-模型-應(yīng)用”的數(shù)據(jù)互通機(jī)制,打通應(yīng)用間壁壘,支持基于上下文的智能交互。

思考二:創(chuàng)新系統(tǒng)抽象接口(面向提高執(zhí)行效能)

隨著模型與操作系統(tǒng)的融合,傳統(tǒng)操作系統(tǒng)的抽象面臨挑戰(zhàn)。現(xiàn)有接口針對命令式服務(wù)設(shè)計,難以滿足智能體的需求:(1)無法充分表達(dá)應(yīng)用語義或?qū)崿F(xiàn)端到端智能優(yōu)化;(2)缺乏原生智能化能力支持,增加了開發(fā)負(fù)擔(dān),限制了智能體間的協(xié)作。同時,現(xiàn)有接口難以暴露底層系統(tǒng)服務(wù)和異構(gòu)硬件能力,導(dǎo)致性能損失。

為應(yīng)對這些挑戰(zhàn),操作系統(tǒng)須引入智能化抽象,支持從單一命令到端到端需求的動態(tài)、靈活表達(dá)。在系統(tǒng)層面,支持多種層次的系統(tǒng)服務(wù)接口,高層接口滿足傳統(tǒng)應(yīng)用和程序使用,底層接口用于高性能智能應(yīng)用優(yōu)化,充分平衡智能的應(yīng)用和系統(tǒng)的實時性。同時,應(yīng)結(jié)合歷史行為和模型智能,利用生成式接口的新特性實現(xiàn)自我優(yōu)化與智能演進(jìn)。

思考三:系統(tǒng)內(nèi)生智能(面向提高智力水平)

當(dāng)前智能體的能力邊界局限于單個應(yīng)用范圍,各應(yīng)用通過外掛模型實現(xiàn)智能化。例如,用戶期望智能體能自動完成日程安排,這需要跨越日歷、會議、郵件等多個應(yīng)用實現(xiàn)協(xié)同。然而,目前面向特定領(lǐng)域的專用模型在適應(yīng)性和魯棒性方面存在明顯不足。典型案例是當(dāng)前的手機(jī)智能助手,雖然能夠執(zhí)行簡單的購物任務(wù),但一旦遇到未經(jīng)訓(xùn)練的廣告彈窗等干擾就極易中斷操作。

為此,模型原生操作系統(tǒng)應(yīng)具備內(nèi)生智能,從而有機(jī)整合來自不同應(yīng)用智能體的能力,實現(xiàn)跨應(yīng)用的無縫配合與復(fù)雜協(xié)同。這就需要構(gòu)建面向操作系統(tǒng)的通用基礎(chǔ)模型,提供系統(tǒng)級智能體服務(wù),并實現(xiàn)模型能力與系統(tǒng)功能的深度融合,支持跨應(yīng)用的無縫協(xié)作;同時,建立高效的持續(xù)學(xué)習(xí)機(jī)制,探索新的操作系統(tǒng)內(nèi)生智能的訓(xùn)練方法,并實現(xiàn)高效、低成本的持續(xù)訓(xùn)練和微調(diào),以更好地滿足用戶多樣化的智能需求。

思考四:智能知識存儲(面向提高智力水平)

模型智能水平與知識型數(shù)據(jù)緊密相關(guān),現(xiàn)有存儲系統(tǒng)主要面向數(shù)據(jù)而非知識,難以滿足大模型對知識生成、管理和利用的需求。在縱向維度,現(xiàn)有系統(tǒng)在設(shè)計上強調(diào)對原始數(shù)據(jù)的存取,缺乏對數(shù)據(jù)語義層次和知識表示的高效支持;在橫向維度,模型應(yīng)用模糊化的輸入使多模態(tài)、多類型的存儲系統(tǒng)關(guān)聯(lián)更加緊密,而異構(gòu)表達(dá)形式給數(shù)據(jù)跨應(yīng)用橫向流動帶來挑戰(zhàn)。

為應(yīng)對這些挑戰(zhàn),在縱向?qū)用妫到y(tǒng)須面向知識存儲最大程度地利用軟硬協(xié)同的通信機(jī)制,提供與硬件演進(jìn)協(xié)同發(fā)展的編程抽象;在橫向?qū)用妫到y(tǒng)應(yīng)通過更高整合度的數(shù)據(jù)結(jié)構(gòu)與通信機(jī)制,實現(xiàn)不同存儲系統(tǒng)數(shù)據(jù)互通與協(xié)作,為模型提供跨應(yīng)用的數(shù)據(jù)融合能力,使多模態(tài)等任務(wù)中的數(shù)據(jù)協(xié)同更加高效,從而提升模型在復(fù)雜場景下的智能水平。

思考五:高效算力供給(面向提高執(zhí)行效能)

模型對算力有著極高的要求。然而,模型原生操作系統(tǒng)在為模型提供算力時,不能僅考慮模型本身的需求,還要綜合考慮算力、內(nèi)存、功耗、智能水平等多個相互制衡的關(guān)鍵指標(biāo)。當(dāng)前異構(gòu)算力硬件體系為智能應(yīng)用提供了關(guān)鍵性的算力支撐,但當(dāng)前操作系統(tǒng)仍然以特殊外設(shè)的方式管理算力硬件,智能應(yīng)用主要依賴專門化適配與設(shè)計來利用特定的算力硬件,導(dǎo)致系統(tǒng)嚴(yán)重碎片化,也大大限制了智能應(yīng)用的發(fā)展和普及。

為應(yīng)對這些挑戰(zhàn),需要在多個層面實施優(yōu)化策略。在模型層面,研究如何在保持模型性能的同時減少參數(shù)量;探索動態(tài)調(diào)整模型結(jié)構(gòu)的方法,并針對智能體等復(fù)雜場景提出針對性的模型微調(diào)和輕量化設(shè)計。在系統(tǒng)層面,探索端側(cè)資源受限場景下的高效推理方案,包括面向操作系統(tǒng)目標(biāo)任務(wù)的模型稀疏化、投機(jī)推理等;同時設(shè)計新的計算卸載方案,在保證用戶數(shù)據(jù)隱私以及對應(yīng)用盡可能透明的前提下,充分利用來自富算力設(shè)備的計算資源。在硬件層面,探索異構(gòu)計算架構(gòu),針對不同類型任務(wù)提供專用處理單元并實現(xiàn)協(xié)同調(diào)度和統(tǒng)一管理,提高整體效率。

思考六:系統(tǒng)安全可靠(面向隱私保護(hù)與系統(tǒng)安全)

隨著大模型系統(tǒng)應(yīng)用越來越廣泛,其在隱私安全與可靠性方面的挑戰(zhàn)也越來越突出。在數(shù)據(jù)隱私方面,一方面大模型在訪問和生成數(shù)據(jù)時,可能會泄露隱私數(shù)據(jù)和敏感信息;另一方面,大模型自身的參數(shù)也是需要保護(hù)的重要數(shù)字資產(chǎn)。在可靠性層面,大模型的輸出存在不確定性,可能導(dǎo)致模型執(zhí)行未經(jīng)授權(quán)的操作或出現(xiàn)偏離預(yù)期的行為;目前的系統(tǒng)往往注重性能和精度等指標(biāo)的提升,缺乏有效的行為審計機(jī)制和約束技術(shù)。

為應(yīng)對這些挑戰(zhàn),在數(shù)據(jù)安全方面,應(yīng)對大模型的參數(shù)和數(shù)據(jù)進(jìn)行“存儲-傳輸-計算”的全生命周期加密保護(hù),嚴(yán)格控制數(shù)據(jù)流轉(zhuǎn)時的訪問權(quán)限,并構(gòu)建輕量化、定制化的可信AI軟件棧,減少攻擊面以提高系統(tǒng)的整體安全性;在可靠性方面,提出面向智能應(yīng)用安全的內(nèi)生安全審計機(jī)制,通過彈性規(guī)則對模型的行為進(jìn)行動態(tài)約束,在保證模型智能水平的同時有效提升確定性。

當(dāng)前探索與實踐

模型原生操作系統(tǒng)作為一種新興的技術(shù)范式,正在成為人工智能大模型從“作詩”走向“做事”的關(guān)鍵。雖然目前尚未出現(xiàn)完全實現(xiàn)這一設(shè)計理念的成熟產(chǎn)品,但國內(nèi)外學(xué)術(shù)界和工業(yè)界已經(jīng)開展了這方面的初步探索。

OpenAI聯(lián)合創(chuàng)始人安德烈·卡帕西(Andrej Karpathy)在2023年11月提出了LLM OS理念,激進(jìn)地用大語言模型替代操作系統(tǒng)(LLM as OS)。美國羅格斯大學(xué)提出的AIOS是LLM OS理念的一次初步實踐。然而,這類探索主要存在兩個局限:一是提出了全新的交互范式和軟件開發(fā)模式,難以有效兼容現(xiàn)有軟件生態(tài);二是將模型作為黑盒使用,并未針對模型的推理效能、智力水平等進(jìn)行針對性地優(yōu)化。作為一種折衷方案,SWE-agent提出了智能體-計算機(jī)接口(Agent-Computer Interface, ACI),將大模型智能體在軟件工程任務(wù)中能夠解決的問題從3.8%提升至18%,驗證了操作系統(tǒng)與大模型協(xié)同的重要性。

除了系統(tǒng)架構(gòu)和編程接口層面的創(chuàng)新,工業(yè)界正在積極探索操作系統(tǒng)智能體技術(shù)。美國Anthropic公司的Computer Use和國內(nèi)智譜公司的AutoGLM等系統(tǒng)通過將云端大模型與圖形界面(GUI)深度融合,實現(xiàn)了智能化的界面操作自動化,在辦公應(yīng)用、社交媒體、在線購物等場景展現(xiàn)出接近人類水平的操作能力。然而,當(dāng)前基于外掛式多模態(tài)大模型的方案在處理動態(tài)UI和復(fù)雜操作時仍面臨挑戰(zhàn)。同時,依賴云端大模型帶來的網(wǎng)絡(luò)延遲和隱私安全問題也亟待解決。

為了支持大模型在端側(cè)設(shè)備中的推理,當(dāng)前業(yè)界提出了多種端側(cè)大模型推理框架,如ExecuTorch、llama.cpp和MLC LLM等,然而這些系統(tǒng)對異構(gòu)算力的利用有限,端側(cè)設(shè)備通常只能運行不超過100億參數(shù)的小型模型,制約了模型原生操作系統(tǒng)的性能水平。為解決這一問題,上海交通大學(xué)推出PowerInfer系列工作,首次探索“模型-系統(tǒng)-芯片”協(xié)同設(shè)計理念,實現(xiàn)端側(cè)大模型的顯著加速。該方案在模型層面采用Turbo Sparse方法提升模型稀疏性,在系統(tǒng)和芯片層面優(yōu)化操作系統(tǒng)推理設(shè)計,實現(xiàn)異構(gòu)算力調(diào)度、神經(jīng)元簇流水線等技術(shù)。實驗結(jié)果表明,PowerInfer-1在個人電腦上實現(xiàn)11.7倍加速,可運行1750億參數(shù)模型;PowerInfer-2讓智能手機(jī)流暢運行470億參數(shù)模型,性能提升27.8倍。

模型原生操作系統(tǒng)除了需要解決端側(cè)推理性能問題,還需要解決智能應(yīng)用在硬件加速器層面的高效調(diào)度問題。當(dāng)前商用GPU缺乏有效的搶占式調(diào)度機(jī)制,實時任務(wù)面臨兩難選擇:要么獨占GPU資源,增加成本;要么等待低優(yōu)先級任務(wù)完成,影響性能。上海交通大學(xué)團(tuán)隊最早在商用GPU上實現(xiàn)了百微秒內(nèi)的任務(wù)搶占和細(xì)粒度的空分算力共享,與將GPU專用于實時任務(wù)相比,整體吞吐能力提升7.7倍,與多任務(wù)共享GPU相比,時延干擾減少99%。當(dāng)前硬件加速器百家爭鳴,系統(tǒng)層面的支持成為競爭關(guān)鍵,團(tuán)隊進(jìn)一步提出了硬件加速器調(diào)度的通用抽象和多層硬件模型,能夠快速支持不同架構(gòu)、品牌、代次硬件加速器的搶占式調(diào)度,以及開發(fā)硬件無關(guān)的通用調(diào)度策略。

結(jié)束語

模型原生操作系統(tǒng)是人工智能時代操作系統(tǒng)的重要發(fā)展方向,需要在模型與系統(tǒng)的深度融合中探索理論創(chuàng)新。這種融合不是簡單的功能疊加,而是要從架構(gòu)到實現(xiàn)進(jìn)行全方位創(chuàng)新,從而推動操作系統(tǒng)的智能化演進(jìn)。雖然學(xué)術(shù)界和產(chǎn)業(yè)界在架構(gòu)設(shè)計、性能優(yōu)化、調(diào)度機(jī)制等方面取得了一系列初步探索,但要實現(xiàn)真正可用的產(chǎn)品級系統(tǒng),仍須在交互范式革新、模型推理效能、系統(tǒng)融合程度、生態(tài)演進(jìn)策略等方面持續(xù)深入研究。

(本文內(nèi)容是基于2024中國計算機(jī)大會(CNCC2024)“大模型基礎(chǔ)軟件”論壇上的報告《模型原生操作系統(tǒng)的一些思考》進(jìn)行的擴(kuò)展)

wKgZO2fT-8qAHpq7AAADrkErmTA829.png

掃碼觀看相關(guān)視頻

wKgZO2fT-8qAJMTdAAAnu5sA3f4332.jpg

陳海波

CCF會士、系統(tǒng)軟件專委會副主任、開源發(fā)展委員會常務(wù)委員。上海交通大學(xué)特聘教授,ACM/IEEE Fellow。主要研究方向為操作系統(tǒng)、分布式系統(tǒng)和機(jī)器學(xué)習(xí)系統(tǒng)等。haibochen@sjtu.edu.cn

wKgZO2fT-8qANOoQAAAr8KldzCU463.jpg

夏虞斌

CCF杰出會員、系統(tǒng)軟件專委會常務(wù)委員、開源發(fā)展委員會執(zhí)行委員、教育工委主任助理。上海交通大學(xué)教授。主要研究方向為操作系統(tǒng)、體系結(jié)構(gòu)等。xiayubin@sjtu.edu.cn

wKgZO2fT-8qANTs9AAAvP3ejQ_g259.jpg

陳榕

CCF杰出會員、CCCF專欄編委。上海交通大學(xué)教授。主要研究方向為操作系統(tǒng)、分布式系統(tǒng)、智能計算系統(tǒng)等。rongchen@sjtu.edu.cn

其他作者:王肇國 糜澤羽 古金宇

CCF推薦

【精品文章】

泛在操作系統(tǒng):研究與實踐 | CCCF精選

分布式系統(tǒng)與可信計算的探索之路——專訪“CCF 海外科技人物獎”獲得者徐潔 | CCCF精選

梅宏:擁抱泛在計算 | CCCF精選

wKgZO2fT-8qAbTdqAACmqtKsn4A804.jpg

wKgZO2fT-8qAeqzZAAC7x5sChNA731.jpg 審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 操作系統(tǒng)
    +關(guān)注

    關(guān)注

    37

    文章

    7122

    瀏覽量

    125258
  • 人工智能
    +關(guān)注

    關(guān)注

    1805

    文章

    48898

    瀏覽量

    247839
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3504

    瀏覽量

    50194
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    華為原生鴻蒙操作系統(tǒng)正式發(fā)布,徹底擺脫內(nèi)核依賴

    電子發(fā)燒友網(wǎng)報道(文/黃山明)近日,華為正式發(fā)布了原生鴻蒙操作系統(tǒng),也是國內(nèi)首個移動操作系統(tǒng),這讓其成為繼蘋果iOS與Android系統(tǒng)后,全球第三大移動
    的頭像 發(fā)表于 10-24 01:07 ?4372次閱讀

    鴻道Intewell操作系統(tǒng):人形機(jī)器人底層操作系統(tǒng)

    操作系統(tǒng)的實時性賦能東土科技的鴻道(Intewell)工業(yè)操作系統(tǒng)作為國內(nèi)唯一通過汽車、工業(yè)控制、醫(yī)療、軌道交通四項功能安全認(rèn)證的系統(tǒng),為標(biāo)準(zhǔn)體系中的技術(shù)層架構(gòu)提供了底層支持。其微內(nèi)核虛擬化架構(gòu)可將人形機(jī)器人電子架構(gòu)成本降低50
    的頭像 發(fā)表于 05-16 14:44 ?181次閱讀

    KaihongOS操作系統(tǒng)FA模型與Stage模型介紹

    FA模型與Stage模型介紹 KaihongOS操作系統(tǒng)中,F(xiàn)A模型(Feature Ability)和Stage模型是兩種不同的應(yīng)用
    發(fā)表于 04-24 07:27

    國產(chǎn)銀河麒麟操作系統(tǒng)V10和星光麒麟V1.0操作系統(tǒng)如何選擇?

    國產(chǎn)銀河麒麟操作系統(tǒng)和星光麒麟操作系統(tǒng)都是由中國電子旗下科技企業(yè)麒麟軟件有限公司(簡稱“麒麟軟件”)開發(fā)的國產(chǎn)自主可控的操作系統(tǒng)。麒麟軟件介紹:麒麟軟件以安全可信操作系統(tǒng)技術(shù)為核心,面
    的頭像 發(fā)表于 01-24 09:14 ?2006次閱讀
    國產(chǎn)銀河麒麟<b class='flag-5'>操作系統(tǒng)</b>V10和星光麒麟V1.0<b class='flag-5'>操作系統(tǒng)</b>如何選擇?

    華為新品出廠默認(rèn)搭載原生鴻蒙系統(tǒng)

    華為近日宣布了一項重要決策,即2025年其手機(jī)、平板、穿戴等新品都將出廠默認(rèn)搭載原生鴻蒙操作系統(tǒng)。這一舉措標(biāo)志著華為在操作系統(tǒng)領(lǐng)域邁出了堅實的一步,也彰顯了其對自主技術(shù)的堅定信心和決心。 據(jù)了解
    的頭像 發(fā)表于 01-03 10:48 ?856次閱讀

    名單公布!【書籍評測活動NO.53】鴻蒙操作系統(tǒng)設(shè)計原理與架構(gòu)

    操作系統(tǒng)從2019年8月9日正式發(fā)布,歷時1778天,歷經(jīng)4代,鴻蒙生態(tài)設(shè)備數(shù)量已超過9億,已有254萬HarmonyOS開發(fā)者投入到鴻蒙世界的開發(fā)中來,鴻蒙學(xué)堂學(xué)習(xí)人次435萬,開發(fā)者服務(wù)調(diào)用次數(shù)
    發(fā)表于 12-16 15:10

    潤和軟件推出首個AI原生操作系統(tǒng)HopeOS V24

    近日,操作系統(tǒng)大會&openEuler Summit 2024在北京隆重舉辦。江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)于會上重磅發(fā)布基于openEuler 24.03 LTS版本的商業(yè)發(fā)行版——潤和企業(yè)級操作系統(tǒng)(服務(wù)器版)HopeOS V24,這也是潤和軟件首個
    的頭像 發(fā)表于 11-17 09:16 ?1276次閱讀

    什么是嵌入式操作系統(tǒng)?

    指揮官配備最先進(jìn)的裝備。 未來會怎樣? 隨著技術(shù)的發(fā)展,嵌入式操作系統(tǒng)將繼續(xù)演進(jìn),以滿足更多的應(yīng)用需求和挑戰(zhàn),它們可能會: 支持更多IoT設(shè)備:管理更多的智能家居和工業(yè)設(shè)備,就像是物聯(lián)網(wǎng)世界的大管家
    發(fā)表于 11-08 15:07

    全新原生鴻蒙HarmonyOS NEXT發(fā)布,書寫國產(chǎn)操作系統(tǒng)新篇章!同時,觸覺智能發(fā)布OpenHarmony5.0固件

    10月22日,華為舉行“原生鴻蒙之夜暨華為全場景新品發(fā)布會”,正式為用戶帶來基于OpenHarmony打造的全新原生鴻蒙操作系統(tǒng)HarmonyOS NEXT和華為多個全場景智能設(shè)備新品。與此同時,觸覺智能旗下鴻蒙開發(fā)板Purpl
    的頭像 發(fā)表于 10-28 13:46 ?1413次閱讀
    全新<b class='flag-5'>原生</b>鴻蒙HarmonyOS NEXT發(fā)布,書寫國產(chǎn)<b class='flag-5'>操作系統(tǒng)</b>新篇章!同時,觸覺智能發(fā)布OpenHarmony5.0固件

    原生鴻蒙操作系統(tǒng)正式發(fā)布,誠邁科技與華為一起共建鴻蒙新世界

    10月22日,我國首個國產(chǎn)移動操作系統(tǒng)——華為原生鴻蒙操作系統(tǒng)正式發(fā)布,這也是繼蘋果iOS和安卓系統(tǒng)后,全球第三大移動操作系統(tǒng)。此次發(fā)布的
    的頭像 發(fā)表于 10-28 09:29 ?1369次閱讀
    <b class='flag-5'>原生</b>鴻蒙<b class='flag-5'>操作系統(tǒng)</b>正式發(fā)布,誠邁科技與華為一起共建鴻蒙新世界

    華為引領(lǐng)國產(chǎn)操作系統(tǒng)邁向新高度

    近日,華為 “原生鴻蒙之夜暨華為全場景新品發(fā)布會” 如同一顆璀璨的科技流星,照亮了國產(chǎn)操作系統(tǒng)的前行之路。全新的原生鴻蒙操作系統(tǒng)(HarmonyOS NEXT)正式登場,標(biāo)志著國產(chǎn)
    的頭像 發(fā)表于 10-24 16:06 ?1469次閱讀

    華為原生鴻蒙操作系統(tǒng)正式發(fā)布

    10月22日晚,華為舉行了一場盛大的發(fā)布會,正式推出了其原生鴻蒙操作系統(tǒng)HarmonyOS NEXT,也被稱為鴻蒙5.0。這一發(fā)布標(biāo)志著鴻蒙系統(tǒng)在功能和體驗上實現(xiàn)了重大飛躍。
    的頭像 發(fā)表于 10-23 16:52 ?1049次閱讀

    鴻蒙生態(tài)設(shè)備超10億!原生鴻蒙發(fā)布,國產(chǎn)操作系統(tǒng)實現(xiàn)自主可控

    10月22日晚間,原生鴻蒙之夜暨華為全場景新品發(fā)布會正式召開,華為常務(wù)董事、終端BG董事長、智能汽車解決方案BU董事長余承東宣布,搭載鴻蒙操作系統(tǒng),包括Open Harmony的生態(tài)設(shè)備超過10億。我們實現(xiàn)了同一個操作系統(tǒng),打通
    的頭像 發(fā)表于 10-23 12:04 ?2495次閱讀
    鴻蒙生態(tài)設(shè)備超10億!<b class='flag-5'>原生</b>鴻蒙發(fā)布,國產(chǎn)<b class='flag-5'>操作系統(tǒng)</b>實現(xiàn)自主可控

    開啟全新AI時代 智能嵌入式系統(tǒng)快速發(fā)展——“第六屆國產(chǎn)嵌入式操作系統(tǒng)技術(shù)與產(chǎn)業(yè)發(fā)展論壇”圓滿結(jié)束

    據(jù)方面的挑戰(zhàn)。從操作系統(tǒng)的視角看,大語言模型可以幫助操作系統(tǒng)更加聰明。RISC-V 作為一種開源和開放指令集,帶來操作系統(tǒng)軟件在不同架構(gòu)之間
    發(fā)表于 08-30 17:24

    嵌入式實時操作系統(tǒng):Intewell操作系統(tǒng)與VxWorks操作系統(tǒng)有啥區(qū)別

    Intewell操作系統(tǒng)和VxWorks操作系統(tǒng)都是工業(yè)領(lǐng)域常用的操作系統(tǒng),它們各有特點和優(yōu)勢。以下是它們之間的一些主要區(qū)別:
    的頭像 發(fā)表于 07-08 14:16 ?764次閱讀
    嵌入式實時<b class='flag-5'>操作系統(tǒng)</b>:Intewell<b class='flag-5'>操作系統(tǒng)</b>與VxWorks<b class='flag-5'>操作系統(tǒng)</b>有啥區(qū)別
    主站蜘蛛池模板: 天天谢天天干 | 91学院派女神 | 私色综合网| 在线亚洲综合 | 色色色色色网 | 手机福利在线 | 成人手机看片 | 伊人yinren6综合网色狠狠 | 国产精品久久久久免费 | 色播四房间 | 国产免费高清福利拍拍拍 | 天天摸天天操天天爽 | 日韩欧美视频在线一区二区 | 国产精品午夜在线观看 | 免费爱爱小视频 | bt天堂在线观看 | 四虎国产精品永久在线播放 | 俺也来国产精品欧美在线观看 | 久久国产午夜精品理论片34页 | 韩国三级在线不卡播放 | 久久国产99| 色爱综合网欧美 | 色秀视频免费高清网站 | 午夜h视频| 让她爽的喷水叫爽乱 | 日本加勒比在线播放 | 免费高清特级毛片 | 九九精品久久久久久噜噜 | 伊人久久大香线蕉综合网站 | 久久综合九色综合网站 | 人人看操 | 一级毛片西西人体44rt高清 | 人操人爱| 午夜精品久久久久久久四虎 | 欧美一级看片免费观看视频在线 | 日韩种子 | 高h文男主又粗又狠 | 国内久久精品 | 四虎精品久久 | 日本a级特黄三级三级三级 日本边添边爱边摸边做边爱 | 4hu四虎永久免在线视 |