日前,美國(guó)人工智能研究公司OpenAI發(fā)布了首個(gè)視頻生成模型“Sora” ,該模型可以根據(jù)文本內(nèi)容生成長(zhǎng)約1分鐘的視頻,這也是人工智能領(lǐng)域一項(xiàng)重要的突破。
OpenAI在官網(wǎng)上詳細(xì)介紹了Sora的功能和特點(diǎn),稱其能夠生成包含多個(gè)角色、特定類型運(yùn)動(dòng)以及精確主題和背景細(xì)節(jié)的復(fù)雜場(chǎng)景。該模型不僅能夠理解用戶在文本提示中所要求的內(nèi)容,更能將這些事物與現(xiàn)實(shí)世界中的存在方式相結(jié)合,呈現(xiàn)出逼真的視頻效果。
此外,Sora還可以根據(jù)靜態(tài)圖片生成動(dòng)畫,并且對(duì)現(xiàn)有視頻進(jìn)行擴(kuò)展,延伸畫面的同時(shí)保持視覺(jué)風(fēng)格的一致性。
作為展示,OpenAI發(fā)布了由Sora生成的視頻,比如一名女足漫步在東京街頭。在這則片段中,無(wú)論是主人公還是她身后的背景人群,動(dòng)作都非常自然流暢。人物面部的細(xì)節(jié)刻畫,也很細(xì)膩逼真,基本沒(méi)有什么違和、突兀的感覺(jué)。
不過(guò),OpenAI也坦承目前Sora也存在一定的弱點(diǎn),它可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景中的物理現(xiàn)象,也可能無(wú)法理解具體的因果關(guān)系。例如,一個(gè)人可能會(huì)咬一口餅干,但咬過(guò)之后,餅干上可能就沒(méi)有咬痕了。
不管怎樣,Sora的問(wèn)世震撼了整個(gè)科技圈。一時(shí)間“Sora會(huì)砸掉誰(shuí)的飯碗?”成為熱議的話題,短視頻和影視行業(yè)自然首當(dāng)其沖。
一眾大佬也是先后發(fā)聲。馬斯克就發(fā)文寫道“gg humans”,意思是人類認(rèn)輸了,心服口服。Sora官號(hào)則互動(dòng)道:現(xiàn)在開(kāi)始由我們來(lái)接管。
還有網(wǎng)友將Sora和特斯拉FSD聯(lián)系中一起,稱二者之間有很多關(guān)聯(lián),馬斯克也回應(yīng):“特斯拉用精確物理原理生成真實(shí)世界視頻大約有一年了。這還不算什么超有趣的事情,因?yàn)樗械挠?xùn)練數(shù)據(jù)都來(lái)自汽車,所以它看起來(lái)就像特斯拉的視頻,盡管它也是動(dòng)態(tài)生成的(而不是記憶的)世界。我們的 FSD 訓(xùn)練計(jì)算能力不足,所以還沒(méi)有使用其他視頻進(jìn)行訓(xùn)練,但當(dāng)然可以。今年晚些時(shí)候,當(dāng)我們有空余能力時(shí),就會(huì)進(jìn)行訓(xùn)練?!?/p>
360創(chuàng)始人周鴻祎也發(fā)文《Sora意味著實(shí)現(xiàn)通用人工智能可能從10年縮短至1年》。

此外,周鴻祎在直播還談到了中美在AI領(lǐng)域之間的差距。他表示,國(guó)內(nèi)的水平離OpenAI至少還有1年以上的差距,并且認(rèn)為除了GPT5外,OpenAI還有其他的“秘密武器”沒(méi)有亮出來(lái),那么中國(guó)跟美國(guó)AI的差距不僅沒(méi)有縮小,反而還在加大。
不過(guò),周鴻祎并不看好Sora在短期可以顛覆短視頻甚至影視行業(yè)。周鴻祎表示,目前Sora具備了產(chǎn)生優(yōu)質(zhì)片段的能力,但不具備講述好一個(gè)完整故事的能力。它更可能成為傳統(tǒng)影視業(yè)有力的生產(chǎn)力工具,從而去激發(fā)更多人的創(chuàng)造力,這也給普通人提供了更多可能性。
來(lái)源:第一電動(dòng)網(wǎng)
作者:MANU
本文地址:http://www.vlxuusu.cn/news/shichang/219424
文中圖片源自互聯(lián)網(wǎng),如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com(#替換成@)刪除。