界面新聞?dòng)浾?| 肖芳
界面新聞編輯 | 劉方遠(yuǎn)
繼去年7月發(fā)布國(guó)內(nèi)首部由大模型深度參與制作的微短劇《山海奇鏡之劈波斬浪》之后,快手近日再次發(fā)布由大模型參與制作的AI單元故事集《新世界加載中》。
《新世界加載中》由異類Outliers團(tuán)隊(duì)制作,共包含7部單元?jiǎng)〖?,涵蓋科幻、奇幻、荒誕喜劇、歷史等多元題材,總時(shí)長(zhǎng)達(dá)180分鐘,該劇也是目前業(yè)內(nèi)敘事體量最大的AIGC劇集作品。
《新世界加載中》總導(dǎo)演、異類Outliers創(chuàng)始人陳翔宇向界面新聞透露,去年他第一次嘗試使用大模型的文生視頻功能之后,用一晚上時(shí)間生成了一輛小汽車飛向太空的短片。這次嘗試讓他意識(shí)到,商用標(biāo)準(zhǔn)影像多了一種來(lái)自AI大模型的、不依賴于實(shí)拍的傳統(tǒng)動(dòng)畫流程的表達(dá)路徑。
陳翔宇因此有了使用大模型制作單元?jiǎng)〖?/span>的想法。在他看來(lái),在制作過(guò)程中,《新世界加載中》實(shí)現(xiàn)了多項(xiàng)技術(shù)突破,包括美學(xué)表達(dá)、鏡頭結(jié)構(gòu)、復(fù)雜動(dòng)作場(chǎng)景與細(xì)節(jié)的全面呈現(xiàn)等。
在觀看《新世界加載中》之后,界面新聞記者也把它和快手去年發(fā)布的《山海奇鏡之劈波斬浪》進(jìn)行了對(duì)比,兩部短片在畫面上確實(shí)呈現(xiàn)出了較為明顯的差異。
一方面是畫面風(fēng)格更加自然多變。《山海奇鏡之劈波斬浪》部分妖怪形象符合中國(guó)古代設(shè)定,但也有一些看起來(lái)風(fēng)格迥異,整體美術(shù)風(fēng)格AI感明顯,給人一種違和的感覺(jué)。相比之下,《新世界加載中》在不同的單元?jiǎng)〖?/span>中嘗試了東方美學(xué)、速涂繪畫、黏土動(dòng)畫等多種風(fēng)格,畫面也更加自然。
另一方面,人物表情、場(chǎng)景、物體比例與透視等細(xì)節(jié)處理更加到位。《山海奇鏡之劈波斬浪》物面部特寫質(zhì)感差,存在表情僵硬、口型對(duì)不上、微表情缺失等問(wèn)題,關(guān)鍵道具存在透視角度不合理、大小比例失調(diào)等問(wèn)題。在《新世界加載中》中,這些問(wèn)題都得到了解決,一些鏡頭的細(xì)節(jié)處理達(dá)到了非常細(xì)膩的程度。
這些變化,主要是因?yàn)橐曨l生成模型在技術(shù)能力上取得了諸多突破。
比如,隨著多模態(tài)融合發(fā)展迅速,新一代模型支持“文本+圖像+音頻”混合輸入,能分別解析各模態(tài)信息,并通過(guò)動(dòng)態(tài)注意力機(jī)制實(shí)現(xiàn)跨模態(tài)信息對(duì)齊,確保生成視頻的視聽(tīng)一致性誤差極小。
在物理規(guī)律與細(xì)節(jié)模擬上,模型借助物理引擎整合,能夠準(zhǔn)確模擬流體動(dòng)力學(xué)、剛體運(yùn)動(dòng)等,咖啡傾倒、布料褶皺、爆炸特效等復(fù)雜動(dòng)態(tài)和細(xì)節(jié)的還原度大幅提升,使生成內(nèi)容更貼近真實(shí)世界。
據(jù)記者了解,《新世界加載中》制作過(guò)程中使用了多款大模型,其中超過(guò)50%的素材由快手旗下可靈AI生成。陳翔宇透露,劇集制作流程當(dāng)中,不僅前期的文生圖、圖生視頻都可以使用可靈AI等大模型生成更多素材,制作中期的動(dòng)畫也可以使用大模型制作。
在陳翔宇看來(lái),AIGC相較于實(shí)拍和動(dòng)畫,不僅是效率的提升,更是試錯(cuò)空間的革命性釋放。“借助AI大模型,我們很好地實(shí)現(xiàn)了人物與風(fēng)格一致性的問(wèn)題。同時(shí),AI大模型也讓制作成本實(shí)現(xiàn)了大幅降低。”
對(duì)于大模型對(duì)整個(gè)制作成本和效率帶來(lái)的改變,陳翔宇并沒(méi)有給出準(zhǔn)確的數(shù)字。他表示,制作過(guò)程中,一些原本需要實(shí)拍的物體以及主創(chuàng)人員都可以用AIGC替代,都是降本增效。
可靈AI產(chǎn)品及運(yùn)營(yíng)負(fù)責(zé)人李楊對(duì)界面新聞表示,這一年時(shí)間AI生成視頻的能力有很大提升,比如可靈AI在語(yǔ)義跟從、運(yùn)動(dòng)表現(xiàn)等方面都有了明顯的進(jìn)步,創(chuàng)作者也能夠用大模型做出效果更加出色的片子。
但李楊也強(qiáng)調(diào),當(dāng)下的AI創(chuàng)作還遠(yuǎn)遠(yuǎn)沒(méi)有達(dá)到一鍵生成的程度。“從拿到工具開(kāi)始,如何寫Prompt、如何調(diào)和生成自己腦海中的效果,這個(gè)非常專業(yè)和考驗(yàn)人的韌性,現(xiàn)在仍以相對(duì)偏專業(yè)創(chuàng)作者為主。”