很多科技界的老饕都還記得,2021年4月舉辦的NVIDIA的GTC線上峰會,英偉達(dá)(NVIDIA)創(chuàng)始人兼CEO黃仁勛變身主廚,將發(fā)布場地挪到了自家廚房。超過一個多小時的發(fā)布會中,其中有14秒的畫面中,老黃的廚房、標(biāo)志性的皮衣,甚至他的表情、動作、頭發(fā)……全都是合成出來的數(shù)字人和背景。當(dāng)時業(yè)界一片嘩然,大呼被老黃“騙了三個月居然沒發(fā)現(xiàn)!”
但隨著AIGC技術(shù)的快速發(fā)展,到今天,無論多么真實的數(shù)字人表演,14秒的時長都已經(jīng)不夠滿足觀眾們的胃口了。那么各位觀眾和老司機,一小時三十分鐘的長度,恰似一部電影的長度的真人數(shù)字人表演夠不夠?老黃的廚房注定要被囿于晝夜與愛,那么星際科幻大片和防暑降溫小貼士一起出現(xiàn)夠不夠?
7月27日14點,中國北京,天氣溫度適中,沒有炎日,適合出門。東三環(huán)邊上的康萊德酒店,“新視界·新壹視頻大模型發(fā)布會”的藍(lán)色系主視覺,科技感十足。在接下來不到兩個小時的時間里,這里,將會發(fā)生改變視頻創(chuàng)作的里程碑事件。
觀眾還沒進(jìn)到會議內(nèi)場,就被場外兩塊屏幕吸引難以移步。數(shù)字人的對話、互動并不鮮見,但與3D數(shù)字人對話的流暢程度、語音語義的理解程度,能否解決復(fù)雜多變的實際應(yīng)用場景的問題能力,甚至數(shù)字人的形象設(shè)計,都是給觀眾留下深刻印象的關(guān)鍵因素之一。
以往科技圈開發(fā)布會,都是以“自嗨”的形式來推進(jìn)的。但這次卻一反常態(tài),還在暖場時段,李冰冰、黃曉明、賈乃亮、王祖藍(lán)、龔俊、楊超越等20多位當(dāng)紅演藝圈明星都發(fā)來祝福和關(guān)注的視頻,祝福的話各有不同,但他們都共同提到了“新壹視頻大模型”,到底是何方神圣?
會議開始,更出人意料的場面出現(xiàn)了。沒有美女帥哥主持人身著華麗的禮服出場,也沒有幽默風(fēng)趣的主持人給現(xiàn)場助興,但每個觀眾的臉上從發(fā)布會開始的第一秒鐘開始就都充滿著不可思議的表情——全世界第一場由真人數(shù)字人作為全程主持人的發(fā)布會就此誕生了。
新壹科技創(chuàng)始人、董事長韓坤和他上百位從四面八方趕來的朋友們,以及幾百位慕名而來的媒體和用戶齊坐在臺下,“大家好,我是你們的老朋友韓坤,我正以數(shù)字人的身份出席這場發(fā)布會,并擔(dān)任主持人。雖然我是個冰冷的數(shù)字人,但我還是能夠體會到比這個夏天北京天氣更熱烈的現(xiàn)場氣氛?!比珗稣坡暲讋印?/span>
從主持人的專業(yè)性要求來說,這個開場白有些平淡,但了解韓坤和他的團(tuán)隊在過去幾年經(jīng)歷的人都明白,這一刻的平淡下面,是何等的激潮澎湃。據(jù)內(nèi)部員工透露,看到韓坤數(shù)字人主持人開口說話的一刻,“以為就是給他本人真人錄的視頻而已?!?/span>
為了穩(wěn)妥,擔(dān)心受到網(wǎng)絡(luò)、硬件、以及其他不可控因素的影響,技術(shù)團(tuán)隊曾建議在發(fā)布會現(xiàn)場和其他公司一樣,展示一些demo和視頻文件即可,“很多大廠都這樣”,大家如是說。但韓坤大手一揮,當(dāng)場拒絕,“要做就來真的!”。
臺下的韓坤真人本人面色平靜,神態(tài)自如,但目光如炬,此刻他仿佛站在視頻+AI的時間坐標(biāo)軸上,回顧從前是成就和輝煌,抬頭遠(yuǎn)眺是光榮和夢想。
在由韓坤的數(shù)字人主持人介紹引導(dǎo)之后,終于輪到他本人登臺演講了。他和他的團(tuán)隊,在過去將近20年的時間里深耕視頻行業(yè)引領(lǐng)視頻行業(yè)趨勢,20年的團(tuán)隊技術(shù)積累終于把創(chuàng)造力賦予了機器,20年來親眼見證從PGC、UGC到AIGC視頻生產(chǎn)力變革,韓坤用他特有的平穩(wěn)的語調(diào)娓娓道來,并沒有太多情緒上的波動,仿佛一切就是順其自然而已。
截至7月底,2023年中國已經(jīng)發(fā)布過100多個大模型,仿佛不發(fā)大模型,就沒資格上牌桌一樣。這種情況下,韓坤直接把目光落在了面向垂直場景、解決垂直需求的垂直大模型上面。
韓坤邀請了好幾位好朋友一起登臺發(fā)布新壹視頻大模型,這是中國第一個聚焦在視頻領(lǐng)域的大模型,是以視頻生成為核心的多模態(tài)AIGC模型?!靶乱家曨l大模型它不僅僅是一個工具,更是一個理解你、理解視頻、理解美學(xué)的藝術(shù)家。”韓坤表情平靜,淡淡地微笑,平靜地介紹。
隨后能讓韓坤真正激動的時刻終于到了。從事了將近20年視頻行業(yè)的工作,韓坤還沒有過當(dāng)導(dǎo)演的行動,但這次,出于對《流浪地球》的喜愛以及對新壹視頻大模型的信心,韓坤當(dāng)場宣布要拍一部《流浪星球3》。不用擼袖子,他直接就對著全場觀眾演示起如何通過新壹視頻大模型來創(chuàng)作一部科幻大片的。
韓坤對著新壹秒創(chuàng)平臺對話框輸入了幾個關(guān)于人類駕駛地球、駛離太陽系并遇到危險的關(guān)鍵詞,新壹視頻大模型的AI幫寫功能立刻就生成了一段腳本,速度和內(nèi)容都讓連臺下坐著的一位編劇嘆為觀止。
韓坤介紹,腳本會在新壹視頻大模型里面進(jìn)行一個圖片的訓(xùn)練,然后大模型會完成腳本生成成分鏡頭的圖片。隨后韓坤表示想要一段有交響樂感覺的配樂,很快AI也替他完成了,韓坤很滿意。隨后就是見證奇跡的時刻了。
短短不到5分鐘,一部將近一分鐘時長的宇宙科幻大片《流浪星球3》的預(yù)告片就完整地呈現(xiàn)了在現(xiàn)場觀眾面前。
全場觀眾掌聲雷動,全新創(chuàng)作的短片,人物表情自然,動作流暢,場景變化也非常壯觀,完全是為真正的《流浪地球3》做了一次預(yù)演。要知道,放在傳統(tǒng)的電影工業(yè)來說,編劇、導(dǎo)演、演員、特效制作、燈光、美術(shù)、拍攝、剪輯、配音、配樂……普通人的科幻夢是遙不可及的。
韓坤表示,新壹視頻大模型實現(xiàn)了從腳本生成,到AI作圖、AI視頻、AI音樂,再到智能剪輯配音的AI全流程視頻創(chuàng)作。讓每個人都能實現(xiàn)高質(zhì)量、高效率、低成本、無門檻的視頻創(chuàng)作。
除了創(chuàng)作《流浪星球3》這樣的科幻大片,通過新壹視頻大模型的秒創(chuàng)平臺,也可以創(chuàng)作像夏日防暑這樣的適合在朋友圈去分享的這種視頻小貼士。隨后新壹科技CEO雷濤在現(xiàn)場直接演示起了如何在短短不到5分鐘的時間里,從一段簡單的文字描述生成一段夏日防暑避暑小秒鐘的視頻制作。
其AI幫寫功能可以快速地把作者想法變成文章(腳本),隨后秒創(chuàng)就開始用把這些文案分成若干個片段,每個片段則匹配一個視頻,隨后就到了一個視頻的草稿。隨后,可以根據(jù)創(chuàng)作者個人喜好,分別可以加入數(shù)字人播報,對片段素材進(jìn)行AI作畫的優(yōu)化、或者對片段素材進(jìn)行AI制作視頻,以及還可以調(diào)背景音樂、配音等等,如此之后,就可以生成一段完整的視頻了。
類似這樣的視頻如果去剪輯可能要花上幾個小時的時間,但是現(xiàn)在通過秒創(chuàng)幾分鐘就可以完成,為了達(dá)到這個效果,秒創(chuàng)除了提供圖片、視頻、聲音、數(shù)字人生成等AIGC的功能以外,還提供了一個千萬級結(jié)構(gòu)化視頻庫為用戶提供匹配服務(wù)。
對于頭部大廠還在發(fā)布會現(xiàn)場放錄制視頻或者Demo,新壹科技的發(fā)布會則凸顯一個真實實時演示。使用基于新壹視頻大模型的秒創(chuàng)平臺可以極大地提高視頻創(chuàng)作者的工作效率,降低創(chuàng)作的門檻,這也使創(chuàng)作者從繁瑣的體力勞動中解放出來,從事真正有創(chuàng)造力的工作。
而在前文提到的英偉達(dá)黃仁勛的廚房發(fā)布會上僅僅展示的14秒特效,則是由幾十個工程師經(jīng)歷3個多月才完成的。要造“假的老黃”,得到攝影棚里拍上幾千張各種角度的照片,通過一套3D掃描把他臉上的每道褶子都采集成數(shù)據(jù)。
而韓坤介紹,通過多模態(tài)的合成,新壹科技可以將真人錄制的視頻和音頻素材,快速生成2D寫實數(shù)字人,基于新壹視頻大模型可以在24小時之內(nèi)完成一個數(shù)字人的訓(xùn)練。
此外,新壹數(shù)字人平臺也可以選擇各種風(fēng)格的3D形象,3D數(shù)字人更適合去制作直播、實時交互場景。3D數(shù)字人設(shè)計自由度更高,同時它支持豐富的表情動作,而且通過算法可以去驅(qū)動它的根據(jù)上下文語境去調(diào)整表情和動作,讓交流更加生動有趣。雷濤現(xiàn)場演示了推薦最近上映的電影,以及北京秋天的穿衣建議,讓在場觀眾近距離、生動地體會到數(shù)字人帶來的全新互動體驗。
而從14秒到一分鐘,再到數(shù)字人主持人主持一場長達(dá)一個半小時的發(fā)布會,體現(xiàn)了AIGC技術(shù)的大爆發(fā),也體現(xiàn)了韓坤和他的新壹科技團(tuán)隊深厚的AI技術(shù)積累和對視頻業(yè)務(wù)的精深掌握。
數(shù)字人并不是僅僅是一個娛樂工具,或者一個簡單的對話體驗,未來幾年所有活躍在互聯(lián)網(wǎng)上的人都會擁有自己的數(shù)字分身,每個人都可以打造一個自己的虛擬IP。隨著元宇宙在產(chǎn)品技術(shù)端的突破和需求端的釋放,數(shù)字人將正式迎來爆發(fā)式增長。
正是基于對數(shù)字人產(chǎn)業(yè)的極大信心,新壹科技還在發(fā)布會現(xiàn)場推出了一款明星數(shù)字人產(chǎn)品——秒祝。秒祝通過對于明星視頻進(jìn)行訓(xùn)練,將明星的形象和聲音完美還原出來,生成對應(yīng)的明星數(shù)字人形象,最終呈現(xiàn)給用戶的是以明星數(shù)字人為主角的個性化定制的祝福視頻。
海外市場,2017年創(chuàng)辦的Cameo在2020年已吸引了超過4萬“名人”入駐,平臺年交易額超過1億美元,年增長率超過450%?;诮?0年視頻行業(yè)資源的積累,新壹科技和國內(nèi)大部分明星都有合作和信任基礎(chǔ),在發(fā)布會開場之前的暖場視頻中,就有李冰冰、黃曉明等20多位明星發(fā)來了祝福視頻。有了這樣的資源基礎(chǔ),新壹科技在秒祝產(chǎn)品上取得進(jìn)展和突破,只是時間問題。
秒祝通過幫助明星和粉絲建立聯(lián)系,從而構(gòu)建了新型的明星與粉絲的關(guān)系,通過秒祝平臺粉絲只要支付少量的費用就可以購買明星個性化的祝福視頻。
而對于企業(yè)用戶來講,數(shù)字人祝福或者是數(shù)字人代言這樣的成本比請明星真人便宜的多,它的交付也要便捷和穩(wěn)定得多。明星數(shù)字人產(chǎn)品的應(yīng)用場景也將延伸到會議、活動、廣告銷售等等,能夠為明星和企業(yè)創(chuàng)造更大的價值。
看起來極為簡單的操作,其背后卻是韓坤和他的新壹科技團(tuán)隊多年苦練內(nèi)功厚積薄發(fā)的小片段。事實上,他們在人工智能領(lǐng)域的探索最早可追溯到2018年以前,彼時他們通過一下科技的自有內(nèi)容平臺,積累了海量的音視頻數(shù)據(jù)和視頻業(yè)務(wù)經(jīng)驗。
2020年底,韓坤和他的團(tuán)隊就將研發(fā)重心轉(zhuǎn)向AIGC視頻生成領(lǐng)域,定位也從專注移動視頻應(yīng)用的公司,轉(zhuǎn)向以視頻為核心應(yīng)用場景的人工智能公司。
了解韓坤和他的團(tuán)隊的人都知道,新壹是在一下科技的基礎(chǔ)上新建的,這樣決定了新壹科技絕非是一匹黑馬突然出現(xiàn)在世人面前,而是以一家在視頻領(lǐng)域有深厚積累的頭部企業(yè)的身份重新回到公眾視野中來。
從韓坤創(chuàng)辦的酷六網(wǎng)成為第一家在納斯達(dá)克上市的視頻網(wǎng)站,到一下科技時期秒拍開創(chuàng)互聯(lián)網(wǎng)產(chǎn)品一周連續(xù)三次登陸《新聞聯(lián)播》的紀(jì)錄,再到秒拍和一直播同時拿下短視頻和直播全網(wǎng)用戶滲透率第一名,以及曾經(jīng)成為國內(nèi)最大的視頻生產(chǎn)平臺、牢牢占據(jù)免費應(yīng)用下載排行榜的榜首10多天的小咖秀,韓坤和他的團(tuán)隊本身就是一段將近20年來不斷創(chuàng)造視頻行業(yè)奇跡、一直引領(lǐng)視頻行業(yè)趨勢的傳奇。
盡管一下科技曾遭遇挫折,但韓坤和他的團(tuán)隊沒有消沉,反而義無反顧投入到AIGC視頻的業(yè)務(wù)中來。四年來的臥薪嘗膽,沉默礪劍,如今光寒十四州。韓坤對此如是說:
“這是我們新的開始,我們把釋放AIGC視頻生產(chǎn)力作為公司新的定位,這也是公司要達(dá)成的首要目標(biāo)。我們的團(tuán)隊起了新壹這個名字,是因為我們決定是從零到一去新建,之所以這樣決定不是因為它容易,而是這樣做最難。我們的決心和信心源自這次新建不是在零的基礎(chǔ)上新建,而是在過去無數(shù)次一下一下敲擊鍵盤積累代碼、一點一點積累技術(shù)、一幀一幀完善視頻產(chǎn)品、一秒一秒與時間賽跑的基礎(chǔ)上新建。零是我們對于過去取得輝煌的態(tài)度,壹是我們對于未來不勝不歸的決心。”
隨著對于釋放AIGC視頻生產(chǎn)力目標(biāo)的確立,韓坤認(rèn)為,新壹團(tuán)隊已經(jīng)成為一支有新的思想、更加有戰(zhàn)斗力的團(tuán)隊。他明確指出:“AIGC會徹底改變我們的未來,未來,誰用AI多誰厲害,這次我相信我們將再次引領(lǐng)時代趨勢,繼續(xù)引領(lǐng)產(chǎn)業(yè)進(jìn)步和發(fā)展,我們的新征程、新團(tuán)隊、新開始,一定會成功?!?/span>
如前文所述,這次新壹科技的新發(fā)布,乃是厚積薄發(fā)。根據(jù)當(dāng)場披露的研發(fā)規(guī)劃路線圖,新壹科技清晰構(gòu)建了一個生態(tài),即基于新壹視頻大模型的推出以秒祝和數(shù)字人為代表的AIGC平臺,在多個不同的垂直場景里面提供產(chǎn)品和服務(wù),覆蓋B端和C端用戶。接下來公司還將發(fā)布一個面向政務(wù)的垂直模型平臺。
今天的視頻產(chǎn)業(yè)將通過AIGC實現(xiàn)飛躍,目前互聯(lián)網(wǎng)80%的流量都是視頻流量,但只有20%的內(nèi)容實現(xiàn)了視頻化,剩下80%的內(nèi)容的視頻化將由AIGC完成,新壹視頻大模型出現(xiàn)是正當(dāng)其時。
中央電視臺導(dǎo)演、國家一級編劇夏蒙在現(xiàn)場感慨地表示,“之前拍攝一部紀(jì)錄片,從拍攝到制作,周期要超過半年。在AI科技面前,我覺得我們的努力有時候不堪一擊。我唯一相信的是美是不會改變的,無論我們科技怎么發(fā)達(dá),它都需要記錄者。但AI的興起一定會顛覆現(xiàn)有的影視的格局,無論如何我們阻擋不了AI前進(jìn)的腳步?!?/span>
AI前進(jìn)的腳步就是由新壹科技這樣的企業(yè)一步一步走出來的,讓我們拭目以待,新壹科技,新的開始,壹定成功。