大模型技術(shù)興起,讓社會加速進(jìn)入了一個嶄新的智能時代。AI技術(shù)的進(jìn)步不僅推動了各行各業(yè)的數(shù)字化轉(zhuǎn)型,也為通信技術(shù)的未來發(fā)展奠定了基礎(chǔ),特別是在邁向6G的過程中發(fā)揮著至關(guān)重要的作用。
在AI革命大背景下,2023年6月,國際電信聯(lián)盟(ITU)完成對6G愿景的框架定義工作,從兩個方面回答了什么是6G[1]。第一,6G將持續(xù)演進(jìn)移動通信,持續(xù)增強(qiáng)移動寬帶eMBB、高可靠低延時通信URLLC,以及海量連接mMTC等三大業(yè)務(wù)場景,提供沉浸式、確定性的通信體驗(yàn)和支撐海量連接的能力;第二,6G將超越移動通信的范疇,實(shí)現(xiàn)通信感知一體化、AI通信一體化,以及空天地泛在的全域連接,讓人們超越人眼“觀察”物理世界,并在虛擬世界中構(gòu)建數(shù)字孿生。6G的愿景是全球共識的重要成果,是向6G全球統(tǒng)一標(biāo)準(zhǔn)邁進(jìn)的重要里程碑。
在三個超越通信的場景中,AI通信一體化主要探討的是如何設(shè)計6G來原生地支撐未來海量的AI服務(wù)和AI應(yīng)用。未來的5到10年,99%的開發(fā)、設(shè)計和文字工作將被AI取代。不久的將來,大模型甚至還將取代架構(gòu)設(shè)計、芯片設(shè)計。這個未來趨勢,將與6G的部署時間窗相重疊。4G LTE的技術(shù)創(chuàng)新,把我們帶入移動互聯(lián)網(wǎng)時代,智能手機(jī)的App 成為了應(yīng)用和服務(wù)的主要載體。進(jìn)入人工智能時代,應(yīng)用和服務(wù)的核心載體將不再是 App,也不再是網(wǎng)站,而是AI-Agent。
AI-Agent是一個能感知,并且能主動采取行動的智能體,能夠根據(jù)環(huán)境自行設(shè)定行動目標(biāo),具有感知學(xué)習(xí)和獲取知識能力,持續(xù)不斷地提升自己的能力。而近年來大模型的成功,也把 AI-Agent 的能力提升到一個全新的水平,不僅僅只是生成式AI,而是交互性AI,可以進(jìn)行復(fù)雜的交互式對話和決策。因此,在6G時代,網(wǎng)絡(luò)的使能對象不僅僅是AI-Agent,而且是人工通用智能AGI(Artificial General Intelligence)。華為最早在2019年提出的“萬物智聯(lián)”(Connected Intelligence)的愿景(如圖1),支持原生AI能力,實(shí)際上就是兩個方面:AGI for 6G 和 6G for AGI [2]。
圖1 : Connected Intelligence = AGI for 6G + 6G for AGI
本文將圍繞AGI for 6G和6G for AGI兩個方面展開,尤其側(cè)重6G for AGI。如圖2所示,6G for AGI就是要回答如何設(shè)計eMBB+、URLLC+、mMTC+等通信能力,以及如何利用網(wǎng)絡(luò)感知能力,共同更好地支撐AI,讓6G成為連接未來AI智能體的神經(jīng)中樞,成為AI學(xué)習(xí)、訓(xùn)練、推理的重要組成部分。這也要求6G系統(tǒng)的設(shè)計必須是一個超越連接的架構(gòu),并進(jìn)一步集成AI-Agent的四大基本功能:感知、認(rèn)知、決策、行動,通過基于意圖的高效能通信,深度融合物理世界和數(shù)字世界,并對物理世界產(chǎn)生作用。
圖2 :6G原生AI能力和6G for AGI的整體框架
AGI for 6G
6G時代AGI的通信基本模式是基于Weaver的效用通信(Effectiveness Communication [3]),也可以簡稱為意圖通信。這是一個超越香農(nóng)通信的框架:香農(nóng)通信只是傳輸比特,然而,比特不代表理解,不具備智能,這是AGI使能的6G通信與傳統(tǒng)通信的本質(zhì)區(qū)別。
基于AI-Agent的6G通信可以分為四類:
- 第一,人與人的第一系統(tǒng)和第二系統(tǒng)通信;
- 第二,機(jī)器與機(jī)器的意圖通信;
- 第三,人與機(jī)器的URLLC通信;
- 第四,基于空間計算的機(jī)器與人的Metaverse 通信。
為支撐基于AI-Agent的6G通信框架,3GPP標(biāo)準(zhǔn)的設(shè)計需要考慮支持感知、學(xué)習(xí)的上行信道,并且能夠支持推理、支持低延時、支持Metaverse的下行信道。下面我們著重介紹前兩類。后兩類的通信在利用基于AI-Agent的框架上與前兩類的使用方法類似,但場景不同,具體的通信需求也相應(yīng)有所不同。
AI-Agent輔助的人與人通信
未來基于大模型的通信,將是物理世界通信和數(shù)字世界通信的有機(jī)融合,會引入AGI后香農(nóng)通信架構(gòu)。以人與人的通信舉例,其核心概念包含兩個部分:
- 第一,每個人可以用一個大模型來代理,這個大模型就是一個GPT;
- 第二,每個人的大模型可以根據(jù)GPT,用空間計算,生成多模態(tài)的虛擬實(shí)時響應(yīng),代表人確定性行為的代理響應(yīng)。在數(shù)字世界中,基于此類GPT代理之間的通信系統(tǒng),稱為第一系統(tǒng)。而對于如喜怒哀樂的情感等非確定性行為,大模型無法準(zhǔn)確學(xué)習(xí)和建模,此時針對這部分信息的溝通傳遞,需要在物理世界進(jìn)行實(shí)時通信,稱為第二系統(tǒng),其亦可基于GPT大模型來設(shè)計。
每個人可以發(fā)布自己的大模型,在人與人的通信之前,可以先獲取對方的大模型,來進(jìn)行兩個大模型之間的第一系統(tǒng)通信,這實(shí)際上是本地通信,不需要用無線通信資源。當(dāng)大模型無法生成第二系統(tǒng)通信的部分時,需要通過無線信道進(jìn)行通信。
6G的AGI與AGI通信(如圖3),內(nèi)信道是香農(nóng)通信,其外信道通信,是神經(jīng)網(wǎng)絡(luò)與神經(jīng)網(wǎng)絡(luò)的通信,是大模型與大模型的通信,是Agent與Agent的通信。這里需要指出,無線空口的GPU化,不能帶來性能提升,反而要付出犧牲功耗的代價。
圖3 :基于GPT大模型的AGI后香農(nóng)通信架構(gòu)
以AI-Agent為輔助的人與人通信是一種先進(jìn)的交互方式,它利用了人工智能的強(qiáng)大能力來增強(qiáng)和優(yōu)化通信過程。在這個框架中,每個人都會擁有兩個主要的GPT大模型:第一系統(tǒng)用于本地智能處理,第二系統(tǒng)用于物理通信。
首先,每個人要訓(xùn)練好自己的第一系統(tǒng)AI-Agent使用的GPT大模型,以及用于物理通信第二系統(tǒng)的GPT大模型。這些訓(xùn)練主要是離線的監(jiān)督學(xué)習(xí),基于一個更廣義用于的通用大模型進(jìn)行訓(xùn)練,可以持續(xù)更新,且可以有人的參與輔助(Human in the loop),從而讓所得的GPT模型更精準(zhǔn)強(qiáng)大。其次,為了檢測第一系統(tǒng)工作是否正常,需要一個涌現(xiàn)的檢測器,當(dāng)發(fā)現(xiàn)有第一系統(tǒng)不能學(xué)習(xí)和建模的部分,則分流給第二系統(tǒng)進(jìn)行學(xué)習(xí)。
這樣就形成了一個快速和慢速結(jié)合的通信架構(gòu):第一系統(tǒng)是快速的,可以由通信雙發(fā)交互各自的AI-Agent來實(shí)現(xiàn)Agent之間的本地閉環(huán)通信,不需占用通信資源(如圖4);第二系統(tǒng)是慢速的,可以用無線信道進(jìn)行通信(如圖5)。值得一提的是,通過基于AGI的意圖通信機(jī)制,第二系統(tǒng)的通信流量與直接的視頻通信相比,可以壓縮百倍甚至千倍。此外,第一系統(tǒng)和第二系統(tǒng)的AI-Agent均可以不斷對通用大模型進(jìn)行刷新。
圖4 :基于GPT大模型的第一系統(tǒng)-快速本地通信
圖5 :基于GPT大模型的第二系統(tǒng)-慢速物理通信
AI-Agent輔助的機(jī)器與機(jī)器通信
對于機(jī)器與機(jī)器的通信,如果直接上傳視覺傳感的結(jié)果(如完整的視頻、點(diǎn)云等信息)去支持在邊/云端用大模型進(jìn)行計算,則需要“極大上行”的流量,能支持的機(jī)器數(shù)量較為受限。如果在終端有初級的AI-Agent, 通過無線信道與云端的大模型計算進(jìn)行Token的實(shí)時對齊,從而利用端-管-云的AI-Agent協(xié)同,就可以實(shí)現(xiàn)海量機(jī)器與機(jī)器的通信(如圖6)。
圖6 :6G機(jī)器與機(jī)器間的意圖通信范式
具體而言,基于AI-Agent的后香農(nóng)通信框架采用意圖通信的方式包括如下步驟:
- 第一步,在終端側(cè)引入AI-Agent對場景進(jìn)行初級預(yù)處理分析,即所謂的面向目標(biāo)的篩選(goal-oriented filtering),從而對傳感數(shù)據(jù)進(jìn)行實(shí)時清洗;
- 第二步,對提取的相關(guān)對象進(jìn)行transformer大模型中所謂的嵌入計算(Embedding)得到意圖的極簡數(shù)學(xué)描述(Token);
- 第三步,通過無線信道傳回邊/云端,實(shí)現(xiàn)雙邊意圖(由Token表示)的實(shí)時對齊,由此完成端-管-云協(xié)同的高效機(jī)器與機(jī)器通信。
與直接的視頻傳輸相比,此傳輸機(jī)制下的流量可以壓縮百倍甚至千倍,從而量級性提升系統(tǒng)可支持的通信用戶數(shù)量。
6G for AGI
6G感知為AI學(xué)習(xí)提供大數(shù)據(jù)源泉
6G網(wǎng)絡(luò)中應(yīng)用AI-Agent服務(wù)的獨(dú)特優(yōu)勢還在于,6G系統(tǒng)是通感融合的。通信感知一體化為無線通信系統(tǒng)帶來了新的機(jī)會——在通信的同時提供無線感知服務(wù)。感知和通信的原生融合,使移動基站和終端可以在不需要額外使用頻譜及增加設(shè)備成本的前提下,通過協(xié)同感知,獲得更大的感知范圍和更高的感知精度。6G更短的無線電波長、更寬的頻譜資源和更大的天線孔徑將使得物理環(huán)境的高精度實(shí)時重構(gòu)成為一種服務(wù),利用這一能力也能反過來在顯著增強(qiáng)無線傳輸性能的同時大幅降低傳輸功耗。
6G感知提取的數(shù)據(jù)不僅僅只是對整網(wǎng)物理世界的建模,也是AI學(xué)習(xí)的大數(shù)據(jù)源泉(如圖7)。人、機(jī)器、車、建筑、材質(zhì),甚至是天氣,都可作為6G感知的對象。無線感知可以通過電波傳播的參數(shù)估計、成像,甚至質(zhì)譜檢測來提供關(guān)于環(huán)境的大數(shù)據(jù)。從厘米波、毫米波,到亞太赫茲等全通信頻譜的感知能力均值得關(guān)注和研究。在高精度感知領(lǐng)域,太赫茲技術(shù)有望得到廣泛的應(yīng)用。
圖7: 6G感知是支撐未來AI大模型的主要數(shù)據(jù)來源
6G提供智能普惠的A-RAN和A-CORE
以ChatGPT為代表的自然語言大模型,在不久的將來,就會達(dá)到和超越人類的能力。然而,其代價是需要基于超算集群的算力才能提供“類人”的智能。比如,擁有5千億的神經(jīng)網(wǎng)絡(luò)參數(shù),需要千萬瓦級的供電才能運(yùn)行,在未來的10年,大概率無法在手機(jī)終端上運(yùn)行。
為了給所有人、所有物提供隨時隨地的智能服務(wù),6G網(wǎng)絡(luò)必須承擔(dān)起智能普惠的責(zé)任。這就需要基于6G網(wǎng)絡(luò)采用基于大模型的“通信(C)+ AI(A)+ 感知(S)”架構(gòu)。而通信-AI-感知的融合,也正是6G的本質(zhì)特征所在。支撐AGI的后香農(nóng)通信架構(gòu),也就是:通信+AI+感知(C+A+S)的移動接入網(wǎng),我們稱之為A-RAN(如圖8)。
圖8:A-RAN架構(gòu):通信-AI-感知融合的接入網(wǎng)絡(luò)
同樣,6G網(wǎng)絡(luò)可以基于 AI-Agent 來構(gòu)建,每個AI-Agent就可以是一個邏輯網(wǎng)元。早在2015年,華為公司2012實(shí)驗(yàn)室就提出應(yīng)用驅(qū)動的網(wǎng)絡(luò),其核心思想是,基于客戶相對應(yīng)用的需求,自動生成定制的網(wǎng)路,應(yīng)用完畢,網(wǎng)絡(luò)也就撤除;A(chǔ)設(shè)施就像全網(wǎng)一部計算平臺,這是一個基于任務(wù)的網(wǎng)絡(luò)架構(gòu),也是6G A-CORE的雛形(如圖9)。
圖9:A-CORE架構(gòu):以任務(wù)為中心的網(wǎng)絡(luò)架構(gòu)
6G AGI構(gòu)建實(shí)時孿生世界
在數(shù)字世界里,根據(jù)應(yīng)用的“意圖”,通過構(gòu)建物理實(shí)體的虛擬副本來模擬和分析現(xiàn)實(shí)世界的行為和性能,就是我們通常所謂的數(shù)字孿生。這里主要對數(shù)字孿生的兩項(xiàng)技術(shù)進(jìn)行闡釋。第一,基于意圖通信,構(gòu)建能夠?qū)崟r反映真實(shí)物理世界的數(shù)字孿生體;第二,基于實(shí)時孿生世界,對物理世界進(jìn)行準(zhǔn)確的時空推理。這兩項(xiàng)技術(shù)具有廣泛的應(yīng)用潛力,可應(yīng)用于如自動駕駛、機(jī)器人、智能工業(yè)生產(chǎn)和遠(yuǎn)程醫(yī)療等眾多場景。
首先,在一個小房間的物理空間里,放置有通信和感知一體化的6G終端,這些6G終端具有AI的算力,可以計算小規(guī)模的AI模型。同時,它們也可以通過無線信號感知物理世界。通過對感知信號進(jìn)行處理,可以生成點(diǎn)云來刻畫和描述物理世界。, P>
之后,根據(jù)給定意圖,通過網(wǎng)絡(luò)中的AI大模型與6G終端的AI小模型之間的AGI通信,有選擇性地重構(gòu)物理世界。這里的孿生世界并不需要完整無缺地描述物理世界,而是識別跟意圖相關(guān)的內(nèi)容。這樣既可以節(jié)省通信開銷,還可以保護(hù)隱私,保護(hù)個人和場地的私密性。
感知系統(tǒng)真正感知的是“點(diǎn)云”信息,也就是三維空間中物體的點(diǎn)陣表示。為了減少數(shù)據(jù)傳輸量和保護(hù)用戶的隱私,我們只會在語義目標(biāo)和原始感知信息匹配時,才會將時空語義信息上傳到云端進(jìn)行融合。為此,我們開發(fā)了獨(dú)特的語義時空融合和預(yù)測算法,可以融合語義信息形成數(shù)字孿生。這使得數(shù)字孿生能夠幾乎實(shí)時地反映我們關(guān)心的信息,同時將上行傳輸帶寬需求降低幾個數(shù)量級。
基于實(shí)時孿生的世界,這里演示一個用自然語言驅(qū)動事物定位和人物追蹤的用例。與目前ChatGPT不同,我們的系統(tǒng)能夠?qū)崟r感知現(xiàn)實(shí)世界,并進(jìn)行語義、時間和空間的推理,最終以自然語言的形式呈現(xiàn)結(jié)果。在這個例子中,物體和人物的移動位置都會以卡通人物渲染的形式實(shí)時顯示在數(shù)字孿生體中。6G AGI系統(tǒng)會根據(jù)感知到的點(diǎn)云信息,判斷是否發(fā)生與預(yù)先設(shè)定的意圖(如“看書”)相關(guān)的動作,并實(shí)時定位相關(guān)事件的空間位置。隨著感知系統(tǒng)的不斷完善,推理的準(zhǔn)確性也將不斷提高。
本文探討了未來大模型時代下的6G原生AGI通信,介紹了
- Connected Intelligence = AGI for 6G + 6G for AGI:
- AGI for 6G:后香農(nóng)通信架構(gòu)使能的效用通信(Effectiveness Communication);
- 6G for AGI:集AI學(xué)習(xí)、訓(xùn)練、推理為一體的普惠智能神經(jīng)中樞;
- 通信、感知、AI融合的 6G A-RAN;
- 基于Agent網(wǎng)元構(gòu)建以任務(wù)為中心的 6G A-CORE。
我們認(rèn)為,6G的本質(zhì)是通信-AI-感知的融合,成為服務(wù)萬千AI-Agent的神經(jīng)中樞。