元宇宙,重構人機關系新場景
作者:邊凱歸(北京大學網絡信息系統(tǒng)研究所副所長)
互聯(lián)網的演進歷程是從中心化、開放的網絡空間,逐步變成去中心化、碎片化的虛擬世界。其中交互技術的不斷發(fā)展,讓傳統(tǒng)用戶輸入和機器輸出,升級成結合視頻和人工智能(AI)的多元化人機交互,將人與人之間的連接重構成為元宇宙分布式社區(qū)中的虛擬關系。雖然面臨著諸多挑戰(zhàn),但這一技術趨勢無疑將引發(fā)網絡空間中資源與利益的重新分配。
交互改變 AI與視頻完成交互
人與人之間的交互是通過捕捉聲音、動作、文字等信號完成信息傳輸的。自人類發(fā)明計算機起,人人交互很大一部分被人機交互所代替。而主流人機交互方式的發(fā)展,可大致劃分為三個階段。
第一個階段是互聯(lián)網時代。在互聯(lián)網時代,人機交互主要是通過手指操作鼠標、鍵盤,眼睛查看顯示屏內容完成。為何如此?因為手指是人類完成精細動作最直接的器官,眼睛是能夠最大化、直接接收外界信息的五官之一。自然地,人類會選擇手指操控鼠標鍵盤完成人類對機器的輸入,眼睛查看顯示器內容完成機器對人類的輸出。
第二個時代是移動互聯(lián)網時代。在移動互聯(lián)網時代,人機交互主要是通過手指操控觸摸屏完成。這種交互技術在全球范圍內的第一次大規(guī)模商用,始于2007年的蘋果手機,至今仍然是所有移動設備的主要交互方式。與第一代交互方式不同,這樣的方式回歸了人類嬰幼兒時期的最基本動作,即用手指在屏幕上指向、點擊、滑動,交互設備由觸摸屏替代了鼠標、鍵盤。
在第三代交互方式出現之前,我們需要審視這樣一個現象。第一代、第二代交互方式普及時,其他的交互方式(肢體動作、語音、肌電、腦電等),和交互設備(體感攝像頭、慣性傳感器、智能眼鏡、智能手環(huán)、智能頭盔)也在不斷涌現。但這些交互方式往往都因為表達能力受限、準確度不高等問題,始終無法取代手指和眼睛在交互方式中的主導地位。
第三個時代是2021年開始構建的元宇宙時代。在元宇宙時代,現實世界中的人類可以和虛擬世界中的智能體(虛擬人、數字財產、數字物品等)進行交互。在元宇宙構建初期,人類仍然通過手指和眼睛與虛擬世界進行交互,就像在玩一場“身臨其境的沉浸式視頻游戲”。與第二代交互方式的區(qū)別在于,其交互設備的多樣性將得到極大擴展。例如,攝像頭、慣性傳感器將捕捉到的人類身體動作、語音等指令展示在視頻游戲中,游戲劇情反饋也會通過智能眼鏡、智能頭盔展示給人類。在不遠的未來,當AI技術不斷發(fā)展,特別是腦機交互技術可以準確讀取人腦信息時,人們就可以不通過動作、語音、打字等其他信號發(fā)送指令,而可以直接將意念所想傳達給設備,解鎖AI技術中這一最神秘的難關。因此,交互的終極方式是視頻和AI——人類通過AI將指令輸入到虛擬世界,同時又通過沉浸式視頻展示將交互結果輸出給人類。
連接改變 去中心化、碎片化的連接
人機交互的方式,不僅關系到人類獲取信息的渠道,同樣也決定了人與人之間在網絡空間中的連接形式。伴隨著人機交互方式的改變,人與人之間的連接形式也將被重新定義和構建。
起初,互聯(lián)網Web1.0時代是一個中心化、開放連接的時代,其主要目標是連接所有的互聯(lián)網公開信息,方便人們檢索和查找信息。用戶通過鼠標、鍵盤,與網站內容進行交互,網頁之間通過超鏈接相連,形成了一張巨大的網。這張網中的節(jié)點是網頁,這些網頁連接著數以億計的訪問者設備,每個網頁都部署在中心化的服務器上。在這個時代,人們的主要需求是檢索和查找網頁信息,而社交、娛樂等需求并不旺盛,人與人之間的關系通過訪問共同網頁而產生,沒有任何人或機構試圖阻礙這種關系的產生。
新華社發(fā)
互聯(lián)網Web2.0時代則變成了一個中心化、割裂連接的時代,其主要目標是連接所有的人,并且最大化地激活人們的社交、游戲、購物、視聽、交易等個性化需求。在這個階段,用戶在不同時空環(huán)境下,通過點擊、觸控等操作表達需求,被網站、app捕捉,并通過推薦系統(tǒng)反饋給用戶個性化內容。因此,此時的互聯(lián)網仍然是中心化的,只是用戶之間的連接已經被逐步割裂。例如,流量較大的網站為了更好吸引用戶,開始經營自己的用戶群體,通過讓用戶注冊,形成了該網站系統(tǒng)下的獨立用戶群體。目前,移動智能手機幾乎所有app都要求用戶進行注冊,每個app的系統(tǒng)內部,用戶之間可以進行連接。但不同網站、app系統(tǒng)的用戶,無法進行互聯(lián)互通。可以說,整個互聯(lián)網像是被割裂成了無數個子網,較大的子網代表了用戶數較多的頭部網站或app。每個子網內部都是中心化的,所有數據都存儲在該網站或app的數據庫中,承載著該網站或app提供的特定業(yè)務(如社交、游戲、視聽等)。用戶在每個子網中都有一個注冊ID,享受著該子網提供的業(yè)務。
而目前,我們正在探索的互聯(lián)網Web3.0時代,則是一個去中心化、碎片化連接的時代,其主要目的是支持人與人通過虛擬世界智能體之間的交互,產生某種虛擬關系。這樣一種新型虛擬關系,將再一次重構元宇宙框架下人與人間的連接形式。用戶在元宇宙中可以創(chuàng)建屬于自己的唯一虛擬身份以及若干虛擬資產和虛擬物品,用戶只需通過虛擬身份在某虛擬社區(qū)進行授權操作,就可以與該社區(qū)中的其他用戶產生虛擬關系。這些虛擬世界的操作,可以通過傳統(tǒng)的點擊、觸控等交互動作完成,也可以通過虛擬現實智能眼鏡、沉浸式AI視頻中的交互動作(眼神、肢體動作)完成,虛擬社區(qū)捕捉到這些交互動作之后,所產生的結果也會通過交互設備(智能眼鏡、智能頭盔)以虛擬視頻方式展示給用戶。同時,這一系列的動作和結果也將會記錄在區(qū)塊鏈上,從而保證數據安全。
顯然,這樣一系列的虛擬操作是以用戶為中心,且完全的分布式和不可預測,不存在任何一個網站或app可以要求用戶必須重新注冊一個ID,也不存在一個超級網站或app可以收集絕大多數用戶的個人數據。人與人之間的連接與否,取決于雙方是否存在虛擬關系,是否授權虛擬身份在虛擬社區(qū)中進行了某個操作。
面向未來 充滿機遇與挑戰(zhàn)
元宇宙時代,在去中心化、碎片化的虛擬世界,以往互聯(lián)網中的資源和利益都會重新分配,產生了很多新的機遇。當然,實現這樣的愿景也存在諸多挑戰(zhàn)。
在構建元宇宙的初級階段,交互方式仍然不可避免地依賴于手和眼睛。沉浸式的交互設備,使得輸入、輸出可以更加逼真,除了視覺、聽覺,還可以包括觸覺、嗅覺等其他多個維度的感官體驗。而當AI交互技術進階到高級階段時,我們就可以脫離手、眼等器官,AI可以讀取人的意念,通過腦機接口,完成人類與虛擬世界的交互,即人們將自己的指令通過腦電波直接輸入給虛擬世界,同時虛擬世界也將反饋結果直接發(fā)送給人腦。這樣一種超級智能的交互過程甚至省去了人的動作發(fā)號施令、用眼睛查看結果等傳統(tǒng)操作,可以直接將交互結果呈現在人腦中。這種方式省去了所有中間環(huán)節(jié),其他第三方更是無法知曉人與人之間在交流什么,從而做到了徹徹底底的去中心化,以及保護了人腦所想的數據安全。
對元宇宙連接的碎片化重構,打破了傳統(tǒng)網絡空間中的業(yè)務壟斷,也將重構傳統(tǒng)的資源和利益分配方式,從而產生了流量與盈利兩方面機遇。首先,由于用戶在元宇宙中的交互關系都只存在于社區(qū)中,而傳統(tǒng)互聯(lián)網巨頭也只會變成一個較大的社區(qū),這會導致用戶更多地將時間分配給具有獨特屬性的中小型社區(qū),他們或將迎來更多流量機遇,而不像現在用戶時間都被頭部網站、app所瓜分。其次,鑒于交互方式多元化,第三方無法輕易捕捉到用戶的所有動作、眼神、意念等數據,無法收集到足夠多的個性化偏好數據,傳統(tǒng)的推薦系統(tǒng)就無法正常運行,也就無法復制互聯(lián)網巨頭所賴以生存的廣告營銷推廣等營利模式,而流量所帶來的利潤將更加平均地分配給不同社區(qū)。
同時,我們需要清醒地認識到,無論從用戶還是社區(qū)著眼,即使實現視頻交互技術下的初級元宇宙,也存在很多困難和挑戰(zhàn)。首先,從實踐來看,多數用戶寧可用一個囊括所有生活服務的超級app,也不愿在不同虛擬社區(qū)之間來回切換。即使用戶發(fā)現很多數據被數據中心所掌握,也會習慣性繼續(xù)使用傳統(tǒng)的互聯(lián)網服務??梢哉f,大部分用戶并沒有意識到中心化的互聯(lián)網對自身數據隱私安全的侵害。其次,流量意味著商業(yè)價值。作為服務提供商的頭部網站、app都不愿意看到人們將時間花在中小型虛擬社區(qū)中,他們仍然希望在虛擬世界構建最大的社區(qū),并吸引足夠多的用戶和使用時間。最后,虛擬社區(qū)是碎片化的,用戶所發(fā)表的文字、圖片、甚至更難捕捉到的信息,分散在更多社區(qū)中,從分散度以及信息監(jiān)測維度上,都無疑大大提高了監(jiān)管的難度。
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。