OpenAI視頻生成模型 機遇與挑戰(zhàn)并存
繼ChatGPT后,近日,美國OpenAI公司發(fā)布了首個視頻生成模型“Sora”。您只要輸入一段文本指令,就可以生成一段逼真的視頻。然而,視頻生成模型在推進人工智能技術(shù)發(fā)展的同時,也引發(fā)了人們對人工智能深度偽造視頻可能加劇錯誤信息和虛假信息傳播的擔(dān)憂。
您現(xiàn)在看到的視頻,就是視頻生成模型“Sora”制作而成。據(jù)美國OpenAI官網(wǎng)介紹,此次發(fā)布的文字轉(zhuǎn)視頻模型可以依據(jù)用戶輸入的指令,生成一段時長可達一分鐘的視頻。比如根據(jù)文本:“一位時尚女性走在東京街頭,街道滿是霓虹燈和城市標(biāo)志。她穿著紅色長裙、黑色皮夾克和黑色靴子,戴著太陽鏡、涂著紅色口紅。”就可以生成眼前這樣的視頻。模型也能獲取現(xiàn)有的靜態(tài)圖像并從中生成視頻,還能獲取現(xiàn)有視頻,進行擴展或填充缺失內(nèi)容。
在“Sora”誕生之前,美國人工智能初創(chuàng)公司Runway就曾推出過類似的技術(shù),但是制作的視頻時長較短。
美國Runway公司創(chuàng)始人 巴倫蘇埃拉:讓我們做一個有云的天空,我可以選擇電影風(fēng)格或預(yù)覽角度。我真的很喜歡這張,它看起來就像光是從云里出來的。人工智能正在掃描圖片,并由此生成一段視頻。你現(xiàn)在可以看到云正在移動,天空正在變暗,暴風(fēng)雨就要來了。
當(dāng)前,包括谷歌和Runway在內(nèi)的多家公司,都在積極研發(fā)此類人工智能項目。但OpenAI強調(diào),“Sora”的突出之處在于其圖像的真實感,以及能夠生成比其他模型更長的視頻片段。不過目前,“Sora”仍然存在缺陷,例如可能混淆一些文本指令中的空間細節(jié),例如左右方向等。
人工智能產(chǎn)品開發(fā)者 莫斯塔克:我認為這是自互聯(lián)網(wǎng)出現(xiàn)以來,我們在技術(shù)上取得的最大飛躍之一,它將創(chuàng)造全新的行業(yè),將使媒體更加令人興奮和有趣。我認為這將不可避免地創(chuàng)造大量新的工作崗位,我認為它將改變一切。
不過人工智能技術(shù)帶來許多新機遇的同時,也不可避免地造成了前所未有的挑戰(zhàn)和隱患。其中,人工智能生成欺騙性內(nèi)容干擾選舉被認為是全球面臨的重要挑戰(zhàn)。
當(dāng)?shù)貢r間1月23日,2024年美國總統(tǒng)選舉共和黨黨內(nèi)初選在新罕布什爾州舉行。在此之前,很多美國選民都表示,自己接到了一通“來自美國總統(tǒng)拜登的電話”。
人工智能生成的虛假電話錄音:真是一派胡言,當(dāng)選票作數(shù)的時候,我們就能知道民主投票的價值了。你要把選票留到11月再投。
很快,白宮新聞秘書皮埃爾就澄清說,這是一則偽造的電話錄音。
意大利《共和國報》報道說,視頻生成模型可以讓“名人或政客說從未說過的話、做從未做過的事”,如果有人利用模型克隆拜登、特朗普或其他競選美國總統(tǒng)或2024年歐洲議會席位的人,可能會加劇錯誤信息和虛假信息的傳播。斯坦福大學(xué)研究員巴西勒·西蒙擔(dān)心,這些工具會在選舉中被濫用,并擔(dān)心公眾將“不再知道該相信什么”。
視頻生成模型也讓靠制作視頻謀生的人以及電影從業(yè)者感到擔(dān)憂。Runway公司創(chuàng)始人巴倫蘇埃拉直言,未來電影制作的門檻和成本將大大降低。
美國Runway公司創(chuàng)始人 巴倫蘇埃拉:用手機就能拍一部被數(shù)億人觀看的電影,這將改變電影業(yè)的格局。
有網(wǎng)友坦言:“幸好人工智能視頻和真實視頻目前不算太難區(qū)分?!?/p>
但也有網(wǎng)友擔(dān)心道:“真是受夠了,我要失去我的工作了。”“捏造的政治宣傳將遍布互聯(lián)網(wǎng)?!?/p>
還有網(wǎng)友質(zhì)疑:“我好奇生成這些視頻的學(xué)習(xí)材料來源,為了生成有效視頻,它需要大量不同的視頻數(shù)據(jù)”“人工智能的發(fā)展就像無人駕駛的汽車,不知道會走向何方。”
專家解讀:生成式人工智能技術(shù)進步明顯
全球生成式人工智能技術(shù)發(fā)展迅猛,廣泛應(yīng)用于越來越多的行業(yè)中。如何看待人工智能的發(fā)展?來聽聽中國科學(xué)院自動化研究所研究員、聯(lián)合國人工智能高層顧問機構(gòu)專家曾毅的解讀。
中國科學(xué)院自動化研究所研究員、聯(lián)合國人工智能高層顧問機構(gòu)專家 曾毅:人工智能“Sora”在生成數(shù)據(jù)的真實性、連續(xù)性上的進步應(yīng)該說是非常明顯的。最新的進展,將視覺和聽覺的數(shù)據(jù)跨模態(tài)的生成,產(chǎn)生的用戶體驗可以說是更上一層樓的。
現(xiàn)階段人工智能仍存在違反常識性錯誤
中國科學(xué)院自動化研究所研究員、聯(lián)合國人工智能高層顧問機構(gòu)專家 曾毅:一方面,我們國家的人工智能相關(guān)的研究和產(chǎn)業(yè)有能力,而且一定要盡快趕上。因為“Sora”相關(guān)的生成式人工智能技術(shù),可以降低人工影視娛樂文化產(chǎn)品等相關(guān)的開發(fā)的成本和門檻。另一方面,也需要指出,這并不意味著生成式人工智能已經(jīng)真正理解了我們的物理世界,并可以完全替代這些產(chǎn)業(yè)當(dāng)中傳統(tǒng)需要人類來完成的工作。比如說現(xiàn)在的“Sora”系統(tǒng)生成的視頻,還有很多違反生活和物理常識的錯誤。
AI快速發(fā)展 監(jiān)管面臨挑戰(zhàn)
中國科學(xué)院自動化研究所研究員、聯(lián)合國人工智能高層顧問機構(gòu)專家 曾毅:未來,應(yīng)當(dāng)在積極探索這些技術(shù)潛在的應(yīng)用和對人類工作的互補的同時,充分地關(guān)注生成式人工智能給社會帶來的潛在的負面影響。比如說“Sora”在連續(xù)的高精度的視頻生成方面,它所采用的這個技術(shù),使產(chǎn)生的人工智能造假的水平,可以說達到了一個前所未有的高度,給眼見為實帶來了更大的挑戰(zhàn)。
中國科學(xué)院自動化研究所研究員、聯(lián)合國人工智能高層顧問機構(gòu)專家 曾毅:而對于公眾而言,區(qū)分虛假信息可以說是難上加難,對于視覺取證、執(zhí)法等等帶來的挑戰(zhàn)也可以說是非常顯著的。一方面,人工智能治理相關(guān)政策的發(fā)展和落實一定要跟上;但另外一方面,生成式人工智能技術(shù)發(fā)展,它的研發(fā)機構(gòu)、企業(yè)要同步地發(fā)展和推廣更高水平的自動化鑒偽技術(shù)。只有這樣,生成式人工智能技術(shù)才能被更健康地研發(fā)和使用。
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。
- 自然資源部通報16個耕地調(diào)查問題典型案例
- 贏者通吃敗者退場 春節(jié)檔為何冰火兩重天?
- 節(jié)后長胖了,用藥就能“躺瘦”嗎?專家:想得挺好
- 八省份因降雪封閉37個路段 關(guān)閉收費站503個
- 山西檢察機關(guān)依法對孫述濤涉嫌受賄案提起公訴
- 山東多地發(fā)布道路結(jié)冰預(yù)警 龍口港進出港船舶全面停航
- 國內(nèi)成品油價調(diào)整 2024年以來首次擱淺
- 有關(guān)推進自動駕駛標(biāo)準(zhǔn)制定的建議 工信部這樣答復(fù)
- 武漢鐵路發(fā)布2月21日計劃停運列車公告
- 2023年度,全國新增97個城市達到千兆城市建設(shè)標(biāo)準(zhǔn)