走進熱門商圈的購物廣場,屏幕上涌現的虛擬人物正在向你推薦當季的最in商品。對,這個和你對話的小姐姐,或小哥哥并不是一個真的人,她是由AI(人工智能)技術或者CG(計算機圖形)技術創造出來的虛擬人。
這幾年來,虛擬人已經徹徹底底的“進入”了我們的生活,有代表商家品牌形象的品牌虛擬人,有舉辦演唱會發表作品的虛擬偶像,甚至有的虛擬人并沒有一個可以真實看到的虛擬形象 ,它默默地潛伏在你辦公軟件、郵件,以及商家/顧客對話系統中。
iiMedia Research(艾媒咨詢)提供的市場數據顯示,虛擬人產業整體保持穩定增長態勢。2021年,中國虛擬人帶動產業市場規模和核心市場規模分別為1074.9億元和62.2億元,預計2025年分別達到6402.7億元和480.6億元。
虛擬人NAVA
其中在中國市場,泛娛樂市場是表現最強勢的領域。《2022年上半年中國虛擬人百強榜》的虛擬人形象有洛天依、柳夜熙、嘉然、泠鳶yousa、乃琳等。其中,洛天依排名第一,柳夜熙和嘉然分別為第二名、第三名。
加上2022年成為元宇宙的“元年”,也側面帶動了虛擬形象在大眾消費領域的普及,人們開始意識到:虛擬人并非存在在真實的世界當中,他們只存在于數字世界里。
隨之也引發了一系列的探討:除了高顏值,虛擬人是否真的有用,他們背后究竟是什么,能否真的去解決問題......
那些“炫技”的虛擬人
人們對于虛擬人的幻想,其實最早來自于虛擬偶像。可愛,高顏值等屬性,構成了人們對她的第一印象。這確實也決定了人們最初就對于虛擬人的概念更多停留在娛樂和情感寄托等領域。
圖源:洛天依微博
從技術上,虛擬偶像其實只是虛擬人的方向之一。最有代表性的虛擬偶像是洛天依,2022年已是她出道第十年,她依然可以憑借著在技術和內容上的不斷投入,以及這十年與粉絲鞏固的“共創式情感”躋身國內最成功的虛擬偶像。
但我們也會發現,十年之久,虛擬偶像不斷涌現,但洛天依到現在也有且只有一個,大部分的虛擬偶像幾乎面臨的都是出道即巔峰——但再而衰,三而竭的局面。
而榜單中的虛擬人“柳夜熙”,其實是典型CG技術的代表,她更像是數字人的范疇。傳統CG技術支撐的數字人,開端來自于好萊塢電影特效公司,通常他們采用真人動作捕捉的方式錄制,優點在于細節和渲染梗真實,但在制造內容的過程中,耗費大量的人力物力。
圖源:百度百科
你會被一場虛擬偶像的表演打動,也會感嘆于視頻片段里那種細致到臉部毛孔的超寫實形象。
可以看到,這兩類虛擬人其實采用著不同的技術路線。
關于后者,今天行業大多數公司都使用的是3D建模的技術——如果要對某個人建模,可能需要采集對應用戶的3D數據,搭建出一個模型。而3D模型做完之后是一個不能動的模型,接下來可能是找到另外一個人,去綠幕前做動作捕捉,包括跟蹤臉部的表情和肢體的動作。動作捕捉之后,再把這些數據綁定到模型的關節點上進行綁定,這樣會生成一段原始的視頻。最后原始的視頻經過單獨的修真和后期渲染,最終形成了大家想要看到的虛擬的視頻片段。
數字人更像是制作生成一個虛擬人的樣貌,但它的內心其實是根據人們的想象演繹出來的。這也決定它在某些方面的上限——比如內容需要定制化生產。
如今更廣泛概念的數字人,其實包括了泛娛樂型數字人和企業級服務數字人,在展現形式上,也有圖文交互和聲音交互的數字人,有真人替代型和身份型虛擬人——但最重要的是,它是否是真人驅動還是AI計算驅動。
虛擬人的背后:一個龐大的技術系統
其實很多前面提到的泛娛樂型虛擬人,都不算是純AI計算驅動的。當然,這也并非是在否定這類虛擬偶像的價值。
只不過,從計算和技術進步的角度來看,AI和深度學習等技術的突破和介入在很大程度上降低了虛擬人的制作門檻。
虛擬人領域,其實囊括的技術要更多。比如擬人的形象就包括建模、動作捕捉等,而交互能力依賴數字化內容、自然語言處理等;對話系統又往往需要一定的樣本學習能力和決策能力。
以前面提到3D建模的技術為例,擬人形象這部分就需要耗費數以百萬的成本。但AI技術介入之后,通過數據驅動的專家系統也可以渲染出虛擬人的形象和臉部表情。
這代表打造虛擬人的兩種技術路徑——以小冰框架的神經網絡渲染技術(XNR)為例,打造虛擬人的第一步,需要訓練兩個專家模型:在大數據上訓練語音專家模型,它能理解人類語音。在目標主播數據上訓練嘴形專家模型,學習目標主播嘴形與表情以及語音之間的關系。第二步,訓練人臉渲染模型,輸入是語音,渲染出正確的人臉,該訓練過程受到之前兩個專家模型的監督。 第三步,驅動過程,輸入語音,形成完整的主播視頻。
通過采用小冰深度神經網絡渲染技術以及小冰框架的小樣本學習技術,整個訓練過程只需要一周。這種方式的成本應該只是3D模型和CAD技術的幾十分之一。
另外,與3D模型應用也不同,依賴技術體系的虛擬人——比如純AI驅動的數字人,其作用更多體現在企業級服務數字人市場,因為它一定程度上縮短了產業鏈,比如動捕、渲染、形象庫等環節增在被純AI技術取代。
尤其是在場景上,兩者也體現著不同:前者建立的是情感紐帶,后者則主要看重它的實用替代價值。
每日經濟新聞的主播N小黑/N小白,其實就是虛擬人替代真人勞作的代表。最初連續播放了70天的新聞,竟然沒有關注發現它不是真人。而依賴背后的AI技術,“訓練”出這樣的員工,僅僅用了一周,然后取代了真實的主播,讓他們把精力放在更有價值的工作上。
圖源:小冰
我們此前介紹過萬科總部的一位年度員工——崔筱盼,她也是一名虛擬人,引發討論的并不只是因為她漂亮的形象,更重要的是她悄悄在萬科財務部工作的十個月,展開催辦的預付應收逾期單據核銷率高達91.44%——甚至超過了財務部的真財務。
圖源:小冰
招商集團也有一名虛擬員工招小影,除去外貌上有著和真人一樣的形態,她也具備一名真人員工同樣的專業領域知識和工作業務自動處理的能力。
圖源:小冰
以上的種種案例都來自于小冰公司的AI Being技術框架。這類虛擬人展現的是知識、智慧和價值。更強調在一個好看的皮囊的基礎上,賦予虛擬人一個有趣的靈魂。
在眾多虛擬人的產業鏈公司中,小冰提供的就是一個端到端的虛擬人生成體系。自從2013年情感計算立項至今,擁有長達九年的框架技術積累,目前才讓小冰的商業化進程得以越來越從容。
最近小冰公司還逆市完成了總額10億元新融資,宣布用于加速AI Being小冰框架技術研發,將對旗下人工智能數字員工(AI Being Employee)產品線啟動年度升級。本次升級加強的技術包括大模型對話引擎、3D神經網絡渲染、超級自然語音及AIGC人工智能內容生成。
在小冰公司CEO李笛看來,“人工智能基礎研究一直是一場厚積薄發的長跑。”所以,作為一家技術公司,李笛喜歡從技術改變生產的底層邏輯來看待問題,他們沒有選擇造IP,而是造了一把“錘子”,解決生產,讓更多的多樣性的虛擬人被市場生產和迭代。
小冰公司也正在邁向一家高效的“虛擬人自動化公司”,它擁有文本、聲音、圖像的AIGC產品化陣列,并且已經實現了商業化的落地。小冰公司宣布,計劃將在未來一個季度內,完成當前小冰框架中運行的全部30萬名數字員工升級,進一步鞏固數字員工產品線的全球領先地位,推動數字員工普及。