Sora問世,一石驚起千層浪
作者:楊易臻 張宣 蔡姝雯
“穿著時(shí)尚的女性漫步在霓虹燈閃爍的東京街頭”“兩艘海盜船在一杯咖啡內(nèi)作戰(zhàn)”……春節(jié)假期,這幾段畫面精美的視頻在朋友圈“霸屏”,這些視頻是美國(guó)人工智能團(tuán)隊(duì)OpenAI新發(fā)布的視頻大模型Sora創(chuàng)作的。
Sora,這個(gè)詞來源于日語(yǔ)中的“天空”,意指無限的創(chuàng)造潛力。2022年底因發(fā)布ChatGPT一炮走紅的OpenAI,又因Sora在全球內(nèi)容創(chuàng)作領(lǐng)域掀起新的風(fēng)暴。
博采眾長(zhǎng),Sora“一騎絕塵”
只需要一段20至30個(gè)詞匯的文本指令或一張靜態(tài)圖像,就可以生成一段視頻,不論是寫實(shí)還是動(dòng)畫風(fēng)格、寬屏還是豎屏,皆可任意選擇。雖然Sora并非首個(gè)可以通過文本生成視頻的大模型,但在時(shí)長(zhǎng)、分辨率等視頻生成模型的關(guān)鍵指標(biāo)上,相比先前的Runway、Pika等文生視頻產(chǎn)品,Sora可謂“一騎絕塵”?!癝ora的誕生,意味著AGI(人工通用智能)的實(shí)現(xiàn)可能從10年縮短至一兩年。”360創(chuàng)始人周鴻祎在微博上宣布。
記者親身體驗(yàn)了此前某款視頻大模型的生成產(chǎn)品,在生成的10秒視頻中,人物表情僵硬、動(dòng)作不協(xié)調(diào),視頻也無法準(zhǔn)確呈現(xiàn)文字描述,與Sora的演示視頻相比,確實(shí)差距巨大。
“Sora的技術(shù)亮點(diǎn)是,讓AI內(nèi)容編輯和生成實(shí)現(xiàn)了從文本、圖像到視頻的本質(zhì)跨越。”中國(guó)計(jì)算機(jī)學(xué)會(huì)理事、南京理工大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院副院長(zhǎng)肖亮認(rèn)為,Sora的底層技術(shù)并不算新,但優(yōu)勢(shì)在于“博采眾長(zhǎng)”,是多項(xiàng)技術(shù)積累、共同作用的結(jié)果。Sora在技術(shù)上的“顛覆性”主要體現(xiàn)在三方面:一是突破當(dāng)前視覺大模型“60s超長(zhǎng)視頻”生成瓶頸,以往的視頻模型大多只能生成時(shí)長(zhǎng)不超過10秒的視頻,而Sora在保證視頻時(shí)長(zhǎng)的同時(shí),還能保持人物和場(chǎng)景的連貫;二是呈現(xiàn)多角度一鏡到底,逼真表現(xiàn)光影幾何、物理關(guān)系;三是較為真實(shí)地遵循物理世界規(guī)律,比如畫筆會(huì)在畫布上留下水墨、人吃漢堡會(huì)留下咬痕等。
OpenAI對(duì)Sora的定位頗具野心,號(hào)稱其并非僅僅是“文生視頻”的工具,而是一個(gè)通用的“物理世界模擬器”——復(fù)現(xiàn)真實(shí)世界的重力、摩擦力等物理現(xiàn)象。這一定位使得Sora未來有望成為跨越各行各業(yè)的“超級(jí)工具”,可用于模擬天氣變化、自動(dòng)駕駛、生物行為甚至軍事場(chǎng)景等。
對(duì)此,南京大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系長(zhǎng)聘副教授過潔表示,實(shí)際上,早有多條技術(shù)路徑瞄準(zhǔn)“模擬物理世界”這一目標(biāo),只不過實(shí)現(xiàn)方式不同。Sora的技術(shù)路徑可以理解為“數(shù)據(jù)驅(qū)動(dòng)”——通過學(xué)習(xí)視頻來理解現(xiàn)實(shí)世界的動(dòng)態(tài)變化,并用計(jì)算機(jī)視覺技術(shù)模擬這些變化?!暗珡腟ora的一些‘翻車’視頻可以看出,它在理解物理世界時(shí)會(huì)遇到困難。”過潔以游戲舉例,在一款射擊游戲中,玩家想要走出屋子射擊“敵人”,Sora很可能會(huì)讓玩家“穿墻而去”?!癝ora是否知道墻是一道物理障礙?在它塑造的世界規(guī)則中,是否有這么一條規(guī)矩,規(guī)定墻是不能穿過的?這些都是未知?!?/p>
“目前Sora接受的所有訓(xùn)練都是人類‘喂’給它的,其實(shí)還是沒有跳脫現(xiàn)階段人類的認(rèn)知范圍。目前還有許多物理規(guī)律連人類都還沒有掌握,人類尚未踏足的知識(shí)領(lǐng)域,Sora也無法理解?!边^潔說。
創(chuàng)意工作,AI仍難以替代人類
“過往的人工智能產(chǎn)品,多半可以分為‘以文生文’‘以文生圖’等類型。它們大多是根據(jù)網(wǎng)上已有的語(yǔ)料來進(jìn)行內(nèi)容產(chǎn)出,對(duì)于我們的工作生活并沒有帶來特別大的改變?!蹦暇┐髮W(xué)人工智能學(xué)院院長(zhǎng)周志華分析,大家之所以對(duì)“文生視頻”的反應(yīng)“有點(diǎn)大”,是因?yàn)橥ㄟ^文字輸入來生成視頻這種方式,更容易讓大家感同身受。
影視娛樂行業(yè)的內(nèi)容創(chuàng)作者,成為最早擁抱AI創(chuàng)作工具的探路人之一。國(guó)內(nèi)一家頭部影視公司的AI項(xiàng)目負(fù)責(zé)人王鈺媛告訴記者,自2022年5月“文生圖”工具M(jìn)idjourney推出測(cè)試版本,她便開始探索AI為內(nèi)容創(chuàng)作帶來的可能性?!癆I目前在影視全流程都有所應(yīng)用,涵蓋前期開發(fā)、中期制作、后期宣發(fā)整個(gè)鏈條。在影視項(xiàng)目的前期開發(fā)中,AI可以協(xié)助頭腦風(fēng)暴,激發(fā)‘腦洞’,還可以輔助背景調(diào)研、制作策劃書、潤(rùn)色大綱、評(píng)估IP等。比如,在動(dòng)畫電影的角色設(shè)計(jì)過程中,需要完成角色的配色、服裝、整體的線稿等,傳統(tǒng)情況下,美術(shù)設(shè)計(jì)師要用三四天時(shí)間才能完成,如果導(dǎo)演不滿意,還需要好幾輪溝通和修改,而利用AI,能迅速生成很多案例給導(dǎo)演和制片方選擇,減少了大量溝通成本?!?/p>
3月6日,一部自稱“完全由AI制作的開創(chuàng)性長(zhǎng)篇電影”在洛杉磯首映。這部《終結(jié)者2》的翻拍作品,由50位藝術(shù)家組成的團(tuán)隊(duì)完成。該團(tuán)隊(duì)使用Midjourney、Runway、Pika等多個(gè)AI工具進(jìn)行創(chuàng)作。結(jié)合過往的使用經(jīng)驗(yàn),王鈺媛認(rèn)為,就整體質(zhì)量而言,目前AI生成的內(nèi)容離商業(yè)質(zhì)量要求還很遠(yuǎn)。比如,控制影片特定畫面的風(fēng)格、色調(diào),保持角色的一致性,制作連貫的長(zhǎng)鏡頭,都是AI目前難以完成的。AI工具更偏向于輔助、提供靈感和參考,沒有辦法完全取代某一個(gè)環(huán)節(jié)。
“不過,大模型確實(shí)有可能顛覆傳統(tǒng)電影的商業(yè)模式。傳統(tǒng)的影視制作,需要編劇、導(dǎo)演、制作團(tuán)隊(duì)、演員等共同協(xié)作,工種細(xì)分程度很高?!蓖踱曟抡f,近幾年興起的短視頻中,遵循“黃金三秒定律”的短視頻,無需在制作上多么精良,但對(duì)視頻創(chuàng)意的要求很高,需要立刻抓住觀眾眼球。對(duì)于這些短視頻創(chuàng)作者,AI就可以成為很好的輔助。
在未來的“眼球爭(zhēng)奪戰(zhàn)”中,拼創(chuàng)意將成為趨勢(shì)。“曾經(jīng)一個(gè)專業(yè)團(tuán)隊(duì)才能制作出的影片,現(xiàn)在有可能一個(gè)人就能完成。不需要商業(yè)融資、不需要花大價(jià)錢請(qǐng)演員、攝影師,人人都可以成為創(chuàng)作者?!蓖踱曟峦茰y(cè),AI將給觀眾帶來更多可選擇的娛樂產(chǎn)品,除了電影、電視劇,短視頻、游戲等更多節(jié)奏緊湊、領(lǐng)域細(xì)分的內(nèi)容和產(chǎn)品將呈現(xiàn)爆發(fā)式增長(zhǎng)?!拔艺J(rèn)為AI工具沖擊的不是某個(gè)具體的工種,而是傳統(tǒng)行業(yè)或者帶有固定思維的人群?!?/p>
新浪潮來襲,教育何為?
“盡管國(guó)內(nèi)大模型產(chǎn)品如雨后春筍大量涌現(xiàn),但實(shí)際發(fā)展還是與美國(guó)存在差距?!睒I(yè)內(nèi)人士表示,究其原因,在于算力、數(shù)據(jù)和人才三個(gè)方面。
當(dāng)下,人工智能已成為產(chǎn)業(yè)創(chuàng)新的關(guān)鍵抓手之一。省政府工作報(bào)告也指出,要更大力度發(fā)展數(shù)字經(jīng)濟(jì),以人工智能全方位賦能新型工業(yè)化,積極構(gòu)建特色化行業(yè)大模型,打造人工智能創(chuàng)新應(yīng)用先導(dǎo)區(qū)。
“江蘇發(fā)展人工智能大模型的一大優(yōu)勢(shì)是高校資源非常充分,但江蘇各個(gè)高校培養(yǎng)的頂尖人才外溢現(xiàn)象比較明顯。”過潔說。
2月27日,南京大學(xué)宣布,將于今年9月面向全體本科新生開設(shè)“人工智能通識(shí)核心課程體系”。課程體系將涵蓋1門必修的人工智能通識(shí)核心課,搭配人工智能素養(yǎng)課,以及各學(xué)科與人工智能深度融合的前沿拓展課,從知識(shí)、能力、價(jià)值觀與倫理三個(gè)維度開展教育教學(xué)。
“近幾年國(guó)內(nèi)許多高校都建立了人工智能學(xué)院,從本科開始專門培養(yǎng)人工智能專業(yè)人才,這是一個(gè)好開端?!敝苤救A表示。南京大學(xué)2018年成立我國(guó)C9高校中第一個(gè)人工智能學(xué)院培養(yǎng)本科生,并率先發(fā)布我國(guó)第一個(gè)人工智能本科專業(yè)教育培養(yǎng)體系。
“從人工智能領(lǐng)域的發(fā)展來看,重要的是打通‘基礎(chǔ)研究—人才培養(yǎng)—?jiǎng)?chuàng)新技術(shù)—產(chǎn)業(yè)發(fā)展’的通道?!敝苤救A說,“基礎(chǔ)研究水平提高了,國(guó)內(nèi)大批研究生能夠接觸和從事與國(guó)際接軌的研究課題。其中一些學(xué)生自然會(huì)走到前沿促進(jìn)基礎(chǔ)研究和技術(shù)創(chuàng)新,他們將成為我國(guó)人工智能產(chǎn)業(yè)蓬勃發(fā)展的生力軍?!保钜渍?張宣 蔡姝雯)
版權(quán)聲明:凡注明“來源:中國(guó)西藏網(wǎng)”或“中國(guó)西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國(guó)西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- “留名”欲望下的自我救贖
- “飛馳”“唐探”劇集上線 影迷會(huì)買賬嗎?
- 積極打造首都高精尖產(chǎn)業(yè)高地
- 形成新質(zhì)生產(chǎn)力 激發(fā)灣區(qū)新動(dòng)能
- 探索未來教育的“中國(guó)方案”
- 未來的糧食這樣種
- 回應(yīng)熱點(diǎn)、直面焦點(diǎn)、不避難點(diǎn) 開放團(tuán)組活動(dòng)凸顯“零距離”的務(wù)實(shí)與開放
- 兩會(huì)聲音日記|推進(jìn)醫(yī)療和教育公平 代表如是說
- 部長(zhǎng)通道|以新氣象新作為推動(dòng)高質(zhì)量發(fā)展取得新成效
- 提升特色地域文化品牌價(jià)值