市場(chǎng) 一電報(bào)道

OpenAI發(fā)布首個(gè)視頻生成模型Sora 馬斯克：人類輸了

MANU 2024-02-18 10:24

日前，美國(guó)人工智能研究公司OpenAI發(fā)布了首個(gè)視頻生成模型“Sora” ，該模型可以根據(jù)文本內(nèi)容生成長(zhǎng)約1分鐘的視頻，這也是人工智能領(lǐng)域一項(xiàng)重要的突破。

OpenAI在官網(wǎng)上詳細(xì)介紹了Sora的功能和特點(diǎn)，稱其能夠生成包含多個(gè)角色、特定類型運(yùn)動(dòng)以及精確主題和背景細(xì)節(jié)的復(fù)雜場(chǎng)景。該模型不僅能夠理解用戶在文本提示中所要求的內(nèi)容，更能將這些事物與現(xiàn)實(shí)世界中的存在方式相結(jié)合，呈現(xiàn)出逼真的視頻效果。

此外，Sora還可以根據(jù)靜態(tài)圖片生成動(dòng)畫，并且對(duì)現(xiàn)有視頻進(jìn)行擴(kuò)展，延伸畫面的同時(shí)保持視覺(jué)風(fēng)格的一致性。

作為展示，OpenAI發(fā)布了由Sora生成的視頻，比如一名女足漫步在東京街頭。在這則片段中，無(wú)論是主人公還是她身后的背景人群，動(dòng)作都非常自然流暢。人物面部的細(xì)節(jié)刻畫，也很細(xì)膩逼真，基本沒(méi)有什么違和、突兀的感覺(jué)。

不過(guò)，OpenAI也坦承目前Sora也存在一定的弱點(diǎn)，它可能難以準(zhǔn)確模擬復(fù)雜場(chǎng)景中的物理現(xiàn)象，也可能無(wú)法理解具體的因果關(guān)系。例如，一個(gè)人可能會(huì)咬一口餅干，但咬過(guò)之后，餅干上可能就沒(méi)有咬痕了。

不管怎樣，Sora的問(wèn)世震撼了整個(gè)科技圈。一時(shí)間“Sora會(huì)砸掉誰(shuí)的飯碗？”成為熱議的話題，短視頻和影視行業(yè)自然首當(dāng)其沖。

一眾大佬也是先后發(fā)聲。馬斯克就發(fā)文寫道“gg humans”，意思是人類認(rèn)輸了，心服口服。Sora官號(hào)則互動(dòng)道：現(xiàn)在開(kāi)始由我們來(lái)接管。

還有網(wǎng)友將Sora和特斯拉FSD聯(lián)系中一起，稱二者之間有很多關(guān)聯(lián)，馬斯克也回應(yīng)：“特斯拉用精確物理原理生成真實(shí)世界視頻大約有一年了。這還不算什么超有趣的事情，因?yàn)樗械挠?xùn)練數(shù)據(jù)都來(lái)自汽車，所以它看起來(lái)就像特斯拉的視頻，盡管它也是動(dòng)態(tài)生成的（而不是記憶的）世界。我們的 FSD 訓(xùn)練計(jì)算能力不足，所以還沒(méi)有使用其他視頻進(jìn)行訓(xùn)練，但當(dāng)然可以。今年晚些時(shí)候，當(dāng)我們有空余能力時(shí)，就會(huì)進(jìn)行訓(xùn)練?！?/p>

360創(chuàng)始人周鴻祎也發(fā)文《Sora意味著實(shí)現(xiàn)通用人工智能可能從10年縮短至1年》。

此外，周鴻祎在直播還談到了中美在AI領(lǐng)域之間的差距。他表示，國(guó)內(nèi)的水平離OpenAI至少還有1年以上的差距，并且認(rèn)為除了GPT5外，OpenAI還有其他的“秘密武器”沒(méi)有亮出來(lái)，那么中國(guó)跟美國(guó)AI的差距不僅沒(méi)有縮小，反而還在加大。

不過(guò)，周鴻祎并不看好Sora在短期可以顛覆短視頻甚至影視行業(yè)。周鴻祎表示，目前Sora具備了產(chǎn)生優(yōu)質(zhì)片段的能力，但不具備講述好一個(gè)完整故事的能力。它更可能成為傳統(tǒng)影視業(yè)有力的生產(chǎn)力工具，從而去激發(fā)更多人的創(chuàng)造力，這也給普通人提供了更多可能性。

來(lái)源：第一電動(dòng)網(wǎng)

作者：MANU

本文地址：http://www.vlxuusu.cn/news/shichang/219424

返回第一電動(dòng)網(wǎng)首頁(yè) >

文中圖片源自互聯(lián)網(wǎng)，如有侵權(quán)請(qǐng)聯(lián)系admin#d1ev.com（#替換成@）刪除。