北京冬奧會上,虛擬人熱度有點高。開賽前夕,央視首位AI手語主播正式亮相,為聽障人士提供專業(yè)賽事解說。近日,有觀眾發(fā)現(xiàn)會場的實時氣象主播,也是一位AI虛擬主持人。
“虛擬人的應(yīng)用場景很廣闊,未來其口碑和商業(yè)化雙重認證,都會給傳統(tǒng)的商業(yè)模式帶來變革。”風語筑副總經(jīng)理張樹玉表示,“樂觀預期,未來一年里,每個人都可能在虛擬世界擁有自己的數(shù)字身份。”
近日,上海證券報記者走訪多家虛擬人相關(guān)企業(yè)了解到,虛擬人頻繁上鏡的背后,是人工智能產(chǎn)業(yè)多年發(fā)展的水到渠成。當數(shù)字經(jīng)濟浪潮來襲,不斷拓展商用邊界的人工智能技術(shù)已然嶄露頭角。
硬核技術(shù)“畫皮畫骨”
在技術(shù)層面,虛擬人并不是新鮮事物。1982年,動畫作品《超時空要塞》中的女主角林明美,憑借動人的歌聲與純真的人設(shè)走紅,成為全球首個虛擬歌手。如今,隨著人工智能技術(shù)不斷迭代,虛擬人正從平面動畫走向廣闊天地。
“解構(gòu)虛擬人的概念可以發(fā)現(xiàn),它的核心在于身份和資產(chǎn)。”民生證券元宇宙首席分析師馬天詣表示,虛擬人的各種應(yīng)用場景,本質(zhì)上是圍繞這兩個核心概念展開,“具體可以分為三種,第一種是真人的分身,比如明星的虛擬形象;第二種是大眾重構(gòu)的虛擬身份,比如大家各種游戲里的角色;第三種是作為一種商業(yè)資產(chǎn)的虛擬偶像。”
萬變不離其宗,人工智能技術(shù)毫無疑問是支撐起虛擬人發(fā)展的關(guān)鍵,背后是新一輪數(shù)字經(jīng)濟浪潮滾滾而來。
“虛擬人至少要具備一個獨一無二的形象,還有一定的交互功能,后者就涉及自然語言學習等方面。”一位業(yè)內(nèi)人士透露,盡管經(jīng)歷了近40年的迭代,虛擬人的制作成本不斷下降,但是單個制作成本依然在百萬元級別。
這么高的造價,虛擬人究竟貴在哪里?
風語筑虛擬人項目負責人陳云翔解釋稱,人物需要大量的毛發(fā)建模,這背后是算力渲染支持。正常成年人一般有10萬根左右的頭發(fā),許多虛擬人為了達到更高的建模要求,頭發(fā)數(shù)量會達到20萬至30萬根。
“我們之前一段動畫CG中,一個核心角色及其服裝的建模面數(shù)就達到400萬,精細到服飾上的水晶珠寶,這些不同立面還會與光影環(huán)境交互,運算量也隨之大幅增加。”疊紙科技相關(guān)負責人透露,公司一段2分鐘的CG動畫《雙城奇遇記》,最終耗時4個月才完成。
此外,動作捕捉也是技術(shù)難點,一位業(yè)內(nèi)人士表示,由于人眼可以在毫秒級別的動作中,判斷出對象是否為真人,因此虛擬人的動作要足夠自然流暢,才能“騙”過人眼。這些都需要強勁的硬件設(shè)備、優(yōu)異的人工智能算法。
為了應(yīng)對未來更大規(guī)模的虛擬人創(chuàng)造,讓人工智能“更聰明”也是行業(yè)需要解決的核心問題。
一個典型的例子便是虛擬人“捏臉”。“好看是一個很主觀的事情,很難直接告訴人工智能如何去做。”談到自動生成外貌,網(wǎng)易瑤臺工程師晚豐表示,目前人工智能訓練中主要手段仍是特征量化,在大量訓練之后,美術(shù)的意見依然至關(guān)重要。“比如,我們將面部的一處細節(jié)調(diào)整幅度設(shè)定為1至11,人工智能就會隨機在區(qū)間調(diào)整,但它是不會考慮整體氣質(zhì)的問題,因為氣質(zhì)無法量化。”
“替代真人”恐難實現(xiàn)
今年初,萬科首位虛擬人員工“崔筱盼”獲評2021年萬科年度最佳新人獎的消息,一度引發(fā)熱議,也讓部分網(wǎng)友擔心,未來虛擬人是否取代人類的工作。
清華大學新聞學院教授沈陽認為,這種擔憂有些多余。虛擬人要完全替代人,有賴于人工智能技術(shù)的進步,短期內(nèi)還不可能實現(xiàn),至少還要幾十年。
畫衣畫皮難畫骨,即使在“人工智能”火爆的今日,虛擬人還遠遠無法比肩自然人,具體來看可以歸納為兩點:談吐與氣質(zhì)。
作為人工智能領(lǐng)域的核心技術(shù),自然語言學習一直是各大技術(shù)巨頭力求攻克的難點。經(jīng)過近10年發(fā)展,在機器學習已取得長足進步的今日,自然語言學習已初現(xiàn)曙光。顯卡龍頭英偉達的CEO黃仁勛在此前的一次演講中,推出了一個無所不知的“Q版黃仁勛”――Toy-Me。演示中,Toy-Me可實現(xiàn)和人的自然語言交流。
“自然人之間的交流,話語間隔的推理時間基本在半秒以內(nèi),這要求計算機在半秒內(nèi)理解自然語義,然后生成最為合適的回答。”前述業(yè)內(nèi)人士表示,這要求虛擬人有巨大的語料庫。英偉達披露,Toy-Me使用的預訓練自然語言處理模型Megatron530B,目前為業(yè)內(nèi)規(guī)模最大,通過達萬億參數(shù)級別的語言模型訓練,在11天時間里,讓AI實現(xiàn)GPT-3(第三代生成式預訓練)的水平。
該業(yè)內(nèi)人士表示,這種技術(shù)距離商業(yè)化依然遙遠,“這個級別的訓練成本接近500萬美元,其依托的語料數(shù)據(jù)接近300TB。”目前,國內(nèi)大部分虛擬人還不具備實時語言交互功能,相關(guān)技術(shù)還有很長的路要走。各類虛擬人更接近于影視工業(yè)化的創(chuàng)作小樣,依托的還是已有的影視技術(shù)。
如果說“談吐”還能通過大數(shù)據(jù)深度學習模擬,“氣質(zhì)”則完全無法用現(xiàn)有技術(shù)復刻,這也是許多游戲行業(yè)人士的共識。
“‘暖暖’作為系列游戲的主角,對我們而言,更多時候是一個活生生的人,有著自己的思想和生活態(tài)度。”疊紙科技相關(guān)負責人表示,從游戲開發(fā)的角度看,這些角色的內(nèi)在氣質(zhì)需要文案師精心把控。在他看來,交互的背后是人物對于所處環(huán)境、所遇事件產(chǎn)生的想法和觀點,這些既跟角色設(shè)定有關(guān),又必須考慮隨時出現(xiàn)的變量??紤]到這些因素,盡管“暖暖”已經(jīng)擁有了不亞于任何虛擬人的3D形象,甚至還有自己的CG短片、MV歌曲,但疊紙科技AI技術(shù)的產(chǎn)出應(yīng)用短期內(nèi)還處于探索階段。
多地召開“新春第一會” 高質(zhì)量發(fā)展、改革創(chuàng)新等被“置頂”
隨著春節(jié)假期結(jié)束,全國多地在蛇年首個工作……[詳情]
16:54 | 深市新能源車企憑頂尖技術(shù)敲開全球... |
13:17 | 315聚焦:OTA平臺大數(shù)據(jù)“殺熟”何... |
12:14 | 三大核心主業(yè)收入齊增長 旭光電子2... |
12:06 | 海航控股公布2月份主要運營數(shù)據(jù) 國... |
11:52 | 多元業(yè)務(wù)協(xié)同賦能 華發(fā)股份財務(wù)穩(wěn)... |
11:41 | 湖南裕能2024年實現(xiàn)扣非后凈利潤5.... |
11:40 | 300775,涉多項違規(guī)! |
11:30 | 中國外貿(mào)信托多項創(chuàng)新舉措助力人民... |
10:43 | 主營產(chǎn)品收入下滑 中信重工2024年... |
10:28 | 亞鉀國際第一大股東擬變更為匯能集... |
10:27 | 博濟醫(yī)藥羥基紅花黃色素A制備方法... |
10:08 | 句象書店打造復合型公共閱讀空間創(chuàng)... |
版權(quán)所有證券日報網(wǎng)
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120180014增值電信業(yè)務(wù)經(jīng)營許可證B2-20181903
京公網(wǎng)安備 11010202007567號京ICP備17054264號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
掃一掃,即可下載
掃一掃,加關(guān)注
掃一掃,加關(guān)注