中國·濟南
山東產業技術研究院智能計算研究院
2022
05 / 24
智研簡報
智/能/計/算? ? ? 計/算/未/來
陳益強院長見證智研院第一屆工會
會員大會召開
我院院長陳益強團隊參與研發的手語
播報數字人“上崗”助力冬奧會!
2 / 28
和虛擬人做同事的日子要來了?資本市場正在
為“虛擬人”們蓄勢待發
CONTENTS
目錄
面向“政產學研金服用”,打造研究機構與企業間體系化、標桿化及標準化合作模式
01
智研快訊
行業資訊
智研院院長陳益強團隊參與研發的手語播報數字人“上崗”助力冬奧會!
技術前沿
和虛擬人做同事的日子要來了?資本市場正在為“虛擬人”們蓄勢待發
陳益強院長見證智研院第一屆工會會員大會召開
03
05
計算機科學家證明,為什么更大的神經網絡可以做得更好
02
深度學習模型模擬大腦地形圖,
有助于回答大腦不同部分如何協
同工作
04
陳益強院長見證智研院
第一屆工會會員大會召開
? ? ? ?工會對于調動廣大職工群眾的積極性,推動社會主義建設事業的發展,具有重要的現實意義和深刻的歷史意義。為進一步完善智研院工會組織建設,規范開展我院工會工作,根據濟南市高新區總工會《關于同意成立山東產業技術研究院智能計算研究院工會委員會的批復》(高新工字〔2022〕1號)文件精神,山東產業技術研究院智能計算研究院工會正式成立。2月22日,智研院成功召開了工會成立暨第一屆工會動員大會。
智研快訊
NEWSLETTERS
? ? ? 會上,智研院副院長楊曉東宣讀了《山東產業技術研究院智能計算研究院工會第一屆會員大會選舉辦法》,全體會員以無記名投票的方式進行了投票,選舉產生了山東產業技術研究院智能計算研究院工會第一屆委員會主席及副主席,第一屆經費審查委員會主任及委員,第一屆女職工委員會主任。
智研快訊
NEWSLETTERS
重磅|智研院院長陳益強團隊參與研發的手語播報數字人“上崗”助力冬奧會!
? ? ? ?2月9日,由北京市委宣傳部、北京市科委、中關村管委會等單位組織的“科技冬奧企業行”大型主題采訪活動第四站啟動,來自市科委、中關村管委會、清華大學、中科院計算所、北京廣播電視臺、凌云光、智譜AI的領導專家以及來自24家媒體單位的記者參與了此次活動。活動第四站采訪了科技冬奧專項“冬奧手語播報數字人”。
? ? ? ? “冬奧手語播報數字人”由北京市科委、中關村管委會支持,智譜AI、凌云光和北京廣播電視臺聯合打造,清華大學賈珈教授團隊和中科院計算所陳益強研究員團隊參與了相關關鍵技術的研究和開發,項目還得到了北京市殘疾人聯合會和市殘聯聾人協會的幫助和支持。這一系統以超大規模預訓練模型為核心技術,自主搭建多模態肢體動作、表情、手指同步采集系統,運用跨模態擬人生成算法、超高精度寫實數字人等行業領先技術,實現冬奧期間賽事新聞的專業手語翻譯播報。
? ? ? ?近日,采用超大規模智能信息模型和虛擬數字人技術,為聽障人士打造的“冬奧手語播報數字人”正式亮相北京衛視,為觀眾帶來冬奧期間賽事新聞的專業手語翻譯播報。
? ? ? 隨即新任工會主席楊建做表態發言,表示將立足本職工作,充分發揮工會組織服務單位發展、維護職工權益的重要作用。?
? ? ? 最后院長陳益強對工會的成立、工會各委員會的組建表示祝賀,并對后續工作寄予期望,他強調,各工會委員應履行好自己的職責,把服務員工作為工會工作的奮斗目標,增強工會的凝聚力和向心力,一起向未來。
? ? ? 在接下來工作中,我院工會將依據《工會法》和《工會章程》行使工會組織的權利和義務,維護好職工的合法權益。同時,積極組織職工加強政治、業務學習,充分發揮主人翁精神,為進一步促進我國科技事業的發展做出貢獻。
?“學識”淵博:語料儲備更豐富
? ? ? 隨著2018年《國家通用手語常用詞表》和《國家通用盲文方案》作為語言文字規范正式發布,為了推廣和普及國家通用手語,“冬奧手語播報數字人”系統完成了《國家通用手語詞典》收錄的8214條通用手語的采集和錄制,并且語法都以聽障群體習慣打法為準,以確保手語播報成果的準確性和專業度,更好地服務聽障人群。
? ? ? 由于當前國內缺少較完善的手語語料數據,研發人員在北京市殘聯及其聾人協會的支持下,邀請超過40余位聾人老師及手語專家進行手語文本轉寫和技術指導,并進行大范圍的聽障群體評測,最終構建了符合國家通用手語規范的國內最大規模多模態手語語料庫,詞匯及語句總規模超10萬。
? 精準翻譯:播報方式更智能
? ? ? ?陳益強表示:與傳統的語音AI播報相比,冬奧手語播報數字人的最大區別是表意的準確性和表達的可懂度。傳統的語音播報的技術特點主要集中在對語音的理解上;而面對聽障人士,手語播報還需要用具有韻律感的手勢、豐富甚至有些夸張的表情來提升播報的可懂度。兩者追求的方向是不一樣的,是不同的技術路線。前者主要是語音與視覺之間的轉換,后者不僅要“聽得懂”更要“做得對”,背后的技術
細節更復雜。從1999年開始中科院計算所就開始研發國家通用手語虛擬人合成系統,通過虛擬人的手語識別與合成技術,幫助聽力障礙者進行交流。該技術在2021年第四屆中國·濟南新動能國際高層次人才創新創業大賽上海賽區成功獲獎。
? ? ? ?為構建能理解、翻譯語音和手語的智能數字大腦,冬奧手語播報數字人系統以超大規模預訓練模型為核心技術,通過語義蒸餾及手語翻譯快編模型,將新聞播報語音蒸餾成語義高度接近的手語文字,并翻譯成符合手語習慣的語序。最終,手語數字腦可以通過計算機模仿聽障人士的大腦,進行手語播報驅動。
? ? ? ?此外,為實現高精度、高自然度的人物形象和手語動作姿態,研發團隊還自主搭建了多模態肢體動作、表情、手指同步采集系統。通過肌肉綁定技術驅動實現面部采集,結合業內領先的語音識別及高清視頻合成等技術,呈現給聽障人群親切自然的冬奧手語播報服務。
? 便利生活:應用場景更廣泛
? ? ? ?目前,冬奧手語播報數字人正在北京衛視《北京您早》節目中對“冬奧賽事集錦”和“一起看冬奧”進行手語播報,手語信息播報服務降低了冬奧節目的運營成本,也便捷了聽障人士收看賽事報道的途徑。
? ? ? ?未來,手語播報數字人有望在機場、車站、銀行等公共場所落地,方便聽障人士生活。此外,手語播報數字人的應用還將助力國家通用手語推廣,推動國家通用手語標準普及,為殘疾人平等參與社會生活創造無障礙環境,讓科技更有溫度。?
技術前沿
ADVABCED TECHNONLGY
計算機科學家證明,為什么
更大的神經網絡可以做得更好
? ? ? ?我們的物種很大程度上歸功于對生的拇指。但如果進化給了我們額外的拇指,事情可能不會有太大改善,每只手一個拇指就足夠了。
? ? ? ?神經網絡并非如此,這是執行類人任務的領先人工智能系統。隨著他們變得更大,他們已經掌握了更多。這讓旁觀者大吃一驚。基本的數學結果表明,網絡應該只需要這么大,但現代神經網絡的規模通常遠遠超出預測的要求——這種情況被稱為過度參數化。
? ? ? ?在領先會議 NeurIPS 上發表的一篇論文中,微軟研究院的 Sébastien Bubeck 和斯坦福大學的 Mark Sellke 為縮放成功背后的奧秘提供了新的解釋。他們表明,神經網絡必須比傳統預期的要大得多,才能避免某些基本問題。這一發現為一個持續了幾十年的問題提供了一般性的見解。
? ? ? “這是一個非常有趣的數學和理論結果。”瑞士洛桑聯邦理工學院的 Lenka Zdeborová 說,“他們以這種非常通用的方式證明了這一點。所以從這個意義上說,它會觸及計算機科學的核心。”
? ? ? ?對神經網絡規模的標準預期來自對它們如何記憶數據的分析。但要了解記憶,我們必須首先了解網絡的作用。
? ? ? ?神經網絡的一項常見任務是識別圖像中的對象。為了創建一個可以做到這一點的網絡,研究人員首先為其提供許多圖像和對象標簽,對其進行訓練以學習它們之間的相關性。之后,網絡將正確識別它已經看到的圖像中的對象。換句話說,訓練使網絡記住數據。更值得注意的是,一旦網絡記住了足夠多的訓練數據,它還能夠以不同程度的準確度預測它從未見過的物體的標簽,后一個過程稱為泛化。
? ? ? ?網絡的大小決定了它可以記住多少。這可以通過圖形來理解。想象一下,將兩個數據點放在XY平面上。你可以將這些點與由兩個參數描述的線連接起來:線的斜率和穿過垂直軸時的高度。如果其他人得到了這條線,以及一個原始數據點的 X坐標,他們只需查看這條線(或使用參數)就可以計算出相應的 Y坐標,這條線已經記住了這兩個數據點。
? ? ? ?神經網絡做類似的事情。例如,圖像由成百上千個值描述——每個像素一個值。這組許多自由值在數學上等價于高維空間中一個點的坐標;坐標的數量稱為維度。
? ? ? ?一個古老的數學結果表明,要將 n 個數據點與曲線擬合,你需要一個具有 n 個參數的函數。(在前面的示例中,兩個點由具有兩個參數的曲線描述。)當神經網絡在 1980 年代首次成為一股力量時,思考同樣的事情是有道理的。它們應該只需要 n 個參數來擬合 n 個數據點——無論數據的維度如何。
? ? ? ?“這不再是正在發生的事情。”德克薩斯大學奧斯汀分校的 Alex Dimakis 說,“現在,我們經常創建參數數量超過訓練樣本數量的神經網絡,這意味著必須重寫這些書。”
? ? ? ?Bubeck 和 Sellke 并沒有打算重寫任何東西。他們正在研究神經網絡通常缺乏的另一種屬性,稱為穩健性,這是網絡處理微小變化的能力。例如,一個不健壯的網絡可能已經學會了識別長頸鹿,但它會將一個幾乎沒有修改過的版本錯誤地標記為沙鼠。2019 年,當 Bubeck 團隊意識到該問題與網絡規模有關時,他們正在尋求證明有關該問題的定理。
Bubeck 說:“我們正在研究對抗性的例子——然后規模就強加給了我們。我們認識到這是一個難以置信的機會,因為需要了解規模本身。”
? ? ? ?在他們的新證明中,這對表明過度參數化對于網絡的穩健性是必要的。他們通過計算將數據點與曲線擬合所需的參數來做到這一點,該曲線具有與穩健性等效的數學屬性:平滑度。
? ? ? ?為了看到這一點,再次想象平面中的一條曲線,其中 X 坐標代表單個像素的顏色,Y 坐標代表圖像標簽。由于曲線是平滑的,如果稍微修改像素的顏色,沿著曲線移動一小段距離,相應的預測只會發生很小的變化。另一方面,對于極度鋸齒狀的曲線,X 坐標(顏色)的微小變化會導致 Y 坐標(圖像標簽)的劇烈變化;長頸鹿可以變成沙鼠。
? ? ? ?Bubeck 和 Sellke 表明,平滑擬合高維數據點不僅需要 n 個參數,還需要 n × d 個參數,其中 d 是輸入的維度(例如,784 表示 784 像素的圖像)。換句話說,如果你想讓網絡健壯地記住它的訓練數據,過度參數化不僅有幫助——它是強制性的。證明依賴于一個關于高維幾何的奇怪事實,即放置在球體表面上的隨機分布的點幾乎都彼此相距一個完整的直徑。點之間的大間隔意味著用一條平滑曲線擬合它們需要許多額外的參數。
? ? ? ?耶魯大學的 Amin Karbasi 說:“證明是非常初級的——沒有繁重的數學,它說明了一些非常籠統的東西。”
? ? ? ?結果提供了一種新方法來理解為什么擴大神經網絡的簡單策略如此有效。
? ? ? ?其他研究揭示了過度參數化有幫助的其他原因。例如,它可以提高訓練過程的效率,以及網絡的泛化能力。雖然我們現在知道過度參數化對于穩健性是必要的,但尚不清楚穩健性對于其他事物的必要性。但是通過將其與過度參數化聯系起來,新的證明暗示穩健性可能比想象的更重要,一個可以釋放許多好處的單一密鑰。
? ? ? ?“穩健性似乎是泛化的先決條件。”Bubeck 說,“如果你有一個系統,你只是稍微擾亂它,然后它就失控了,那是什么樣的系統?這是不合理的。我確實認為這是一個非常基礎和基本的要求。”
技術前沿
ADVABCED TECHNONLGY
深度學習模型模擬大腦地形圖,
有助于回答大腦不同部分
如何協同工作
? ? ? ?大腦中處理視覺信息的部分——顳下(IT)皮層——受損可能是毀滅性的,尤其是對成年人而言。那些受影響的人可能會失去閱讀能力(一種稱為失讀癥的疾病)或辨認面孔(面容失認癥)或物體(失認癥)的能力,目前醫生無能為力。
? ? ? ?更準確的視覺系統模型可以幫助神經科學家和臨床醫生為這些疾病開發更好的治療方法。
? ? ? ?近日,卡內基梅隆大學(CMU) 的研究人員 開發了一種計算模型——交互式地形網絡(ITN),使他們能夠模擬 IT 的空間組織或地形(topography),并更多地了解相鄰的腦組織簇是如何組織和相互作用的。 這也可以幫助他們了解該區域的損壞如何影響識別面部、物體和場景的能力。
? ?該研究以“A connectivity-constrained computational account of topographic organization in primate high-level visual cortex”為題,于 2022 年 1 月 18 日發布在《PNAS》上。
? ? ? ?論文一作 Nicholas M. Blauch 博士說,這篇論文可能會幫助認知神經科學家回答關于大腦不同部分如何協同工作的長期問題。
? ? ? ? “長期以來,我們一直在想,我們是否應該將大腦中響應面部的區域網絡視為一個單
獨的實體,僅用于識別面部,或者我們應該把它作為目標識別的神經結構的一部分,”Blauch 說。“我們正在嘗試使用一個假設這種更簡單、通用的組織的計算模型來解決這個問題,并看看這個模型是否可以解釋我們通過學習執行任務在大腦中看到的專業化。”
? ? ? ?為此,研究人員開發了一種深度學習模型: 交互式地形網絡 (ITN),該模型具有生物大腦連接的附加特征,假設該模型可以揭示 IT 的空間組織或地形。
交互式地形網絡
? ? ? ?ITN,一種用于高級視覺皮層計算建模的框架,特別是其功能性地形組織。ITN 模型被定義為神經網絡模型,其:(1)優化以執行自然任務;(2)以生物學上合理的方式約束連接以產生功能組織。
? ? ? ?在這項工作中,介紹了一種 ITN 形式,它分為三個部分:近似早期視覺皮層的編碼器、近似顳下皮層的交互式地形 (IT) 層,以及一個或多個下游任務的讀出機制。編碼器的目標是提取描述視覺世界的一般視覺特征,這些特征沿著支持廣泛的下游讀出任務的維度。
? ? ? ?研究人員的主要建模重點是 IT 層 ,它由一系列受生物約束的循環層對組成。為了計算簡單,這些約束沒有在編碼器中建模。
? ? ? ?首先展示了特定 ITN 模型的模擬結果,將其稱為主模型或「E/I-EFF-RNN」,這表明它具有負責激發和抑制(E/I)的獨立神經元。前饋連接是嚴格興奮性(EFF)的限制,時間循環處理是通過學習橫向連接(RNN)介導的。此外,該模型使用 ResNet-50 編碼器,該編碼器在大型數據集上進行了預訓練,包括來自對象、面部和場景域的多個類別,并在預訓練后用作特征提取器它為包含單獨的 pIT、cIT 和 aIT 區域的三區域 IT 提供輸入。
? ? ? ?訓練后,該模型在各個領域表現良好,在人臉域達到了 86.4% 的分類準確率,在物體域達到了 81.8%,在場景域達到了 65.9%。跨域的性能差異不太可能是特定架構的產物,因為它們可以在各種 DCNN 中看到,這反映了每個任務的內在難度,由于給定圖像集的每個域的類別內部和類別之間存在可變性。
? ? ? ?為了進一步確認地形組織的功能意義,研究人員分析了從 aIT 到本地類別讀出層的讀出權重的空間組織。研究發現平均讀數權重與每個域的平均響應之間存在很大的正相關(所有 rs > 0.7,所有 Ps < 0.0001),進一步證明了響應地形的功能意義。
損傷分析
? ? ? ?接下來,研究人員在模型中進行了一系列損傷分析,以與面部和物體識別的神經心理學數據進行比較。 首先,做了局灶性病變。
? ? ? ?研究表明:以每個域為中心的局灶性病變導致對該域的識別異常嚴重,而對其他域也有較輕微但顯著的缺陷。 對于此類病變,所有域的缺陷均顯著(所有 Ps < 0.05),并且對目標域的識別顯著更強(所有 Ps < 0.05)。
? ? ? ?局灶性病變引起的非首選區域的部分但不是全部損傷可能是由于不完善或非圓形的地形功能組織造成的。重要的是,病變的這些更分散的影響表明,功能組織雖然高度專業化,但并不是嚴格模塊化的;對那些聲稱是給定模塊的一部分的單元(例如,用于面部識別)的損壞仍然會影響對象識別(盡管程度較弱)。
? ? ? ?“對其他領域有一些殘留的損害,”Blauch 說。“與首選域相比,它很小,但它向我們表明,這些網絡中的專業化可能很強,但也有些混雜。結合整個系統采用的一般原則,這意味著它可能被認為是一個具有內部專業化的系統,而不是一組獨立模塊的集合。”
? ? ? ?一個通用的、靈活的系統在損傷后可能更有能力進行重組,正如我們在兒童身上看到的那樣,與具有類似損傷的成年人相比,兒童在幼年受損后視覺功能基本上恢復了。
限制和未來方向
? ? ? ?目前的工作僅涉及高級表示的地形組織。在卷積層中建模拓撲組織是 ITN 框架的一個特殊挑戰。這些架構和其他生物學上合理的變體是一個令人興奮的機會,可以從基于連接的約束條件中檢查地形組織。
? ? ? ?與此相關的是,盡管 ITN 由于區域間空間的限制,在解釋分層的地形組織方面具有優勢,但它還不能令人滿意地具體解釋分層表征轉換的某些方面,增加了對 3D 旋轉的不變性。未來工作迫切需要將 ITN 框架擴展到更強大的計算架構、訓練環境和學習規則,而不是將這種計算能力委托給不同的編碼器。
? ? ? ?ITN 模型和靈長類 IT 的總體表征空間之間存在一些差異。更詳細地比較不同的 ITN 模型在定量和定性上解釋 IT 皮層的效果是未來研究的一條令人興奮的路線。
? ? ? ?雖然該工作比以前的工作提高了生物學的合理性,但通過結合布線約束、興奮和抑制的分離以及區域之間的興奮性連接,額外的生物學細節可能對視覺皮層的計算和組織很重要。未來的工作可能會考慮結合細節。
該研究工作對認知神經科學具有重要意義,提供了地形功能專業化的領域一般發展說明,對于計算神經科學,通過展示如何將眾所周知的生物學細節納入神經網絡模型以解釋經驗發現。
行業資訊
和虛擬人做同事的日子要來了?資本市場正在為“虛擬人”們蓄勢待發
“
”
? ? ? 在電影《銀翼殺手2049》呈現的賽博朋克世界里,主人公K是一個采用未來科技制造出來的復制人殺手,生性孤僻、沉默、不善于表達。但面對愛人喬伊時,他卻十分溫暖,因為這位女子給予了他極大的愛與關懷。不過,對于K來說,這位貼心的伴侶實際上只是一個由家中投影裝置投射出來的虛擬人,看得到卻摸不著,這成為了阻擋在二人面前最大的困難。
? ? ? ?《銀翼殺手2049》的故事背景設定在2049年,然而,現實社會的發展卻比藝術作品更快、更迅猛。
? ? ? ?2022開年,虛擬人占據了各大媒體平臺的頭版頭條。1月15日晚間,央視財經頻道經濟信息聯播,專門用了近10分鐘的時間報道“虛擬人來了”專題。無論是在跨年晚會還是各大網絡平臺內容中,虛擬人的頻繁亮相都不斷刷新著觀眾的認知,資本市場也正為“虛擬人”們蓄勢待發。
? ? ? ?1月6日,成立不足三個月的杭州李未可科技有限公司宣布完成數千萬元天使輪融資,由字節跳動獨家投資。打動字節的正是其旗下一個名叫“李未可”的AR科技潮牌及同名虛擬IP形象。紫發、鵝蛋臉、中性風,僅從外形上看,李未可就像是游戲世界里特別能打的那種大女主。
? ? ? ?目前其在抖音上僅發布20條作品,卻擁有60.8萬粉絲,收獲166.3萬點贊。同時,還單獨在B站連載個人視頻漫劇《未可WAKE》。在AI虛擬賽道上,“李未可”也是字節跳動繼入股虛擬偶像團體A-SOUL、收購VR創業公司Pico后的又一次加碼。
? ? ? ? 據不完全統計,自2021年7月以來,與虛擬數字人相關的核心投融資事件已有18起,投資金額最高達4億元。
? ? ? ?2021年,資本市場最大的狂歡非“元宇宙”莫屬,而究竟何時能讓概念走進現實尚未可知,但作為“元宇宙”世界里的重要角色,虛擬數字人或已接棒成為2022年的最大風口之一。
01??虛擬數字人潮起
? ? ? ?提及最早的虛擬人角色,中國第一位現象級虛擬歌姬、初音未來的同門師妹,2012年出道的洛天依是個繞不過的名字。她奠定了大多數國人對虛擬偶像的想象—灰發、綠瞳、發飾碧玉、腰墜中國結,一個年僅十五歲的少女,極具二次元氣息。
? ? ? ?2019年,愛奇藝推出虛擬偶像廠牌RICH BOOM、華納音樂旗下電音廠牌WhetRecord簽約虛擬偶像“哈醬”;2020年,經紀公司樂華娛樂聯合字節跳動推出虛擬偶像女團A-SOUL、愛奇藝推出虛擬選秀節目《跨次元新星》、天貓超市品牌IP形象“小鐺家”正式上線……不過,彼時的虛擬偶像們更多地還是面向二次元市場在狂歡。
? ? ? ?步入2021年,虛擬的“人性”表現越發明顯,“偶像”的概念也隨之大眾化,虛擬數字人開始席卷人類社會。它不再只是屬于偶像IP圈層的符號,而是進入到更多元的社會角色里。
? ? ? ?先是虛擬頂流洛天依頻繁破圈,從登上春晚舞臺,到和李佳琦同臺直播,甚至開始和Vsinger家族成員跨界帶貨;再就是首個國風虛擬KOL“翎”亮相央視綜藝《上線吧!華彩少年》,并在之后與特斯拉、奈雪的茶、Keep等品牌展開了商業代言合作;緊接著,“超寫實數字人” Ayayi憑借一張證件照躥紅小紅書,一夜漲粉近4萬,首發帖閱讀量近300萬,躋身虛擬KOL頭部行列。Ayayi此后也開始和多個品牌達成合作,包括嬌蘭、保時捷和安慕希等,她還作為“數字員工”入駐了阿里,成為天貓超級品牌日的數字主理人。
? ? ? ?越來越多品牌都搭上了虛擬數字人的快車,除了合作,還有不少企業自創虛擬代言人形象。像麥當勞的“開心姐姐”、康師傅的“許星悠”、屈臣氏的“屈晨曦”和國產彩妝花西子的同名虛擬人等。
02??巨頭紛紛入局
? ? ? ?不同于 Ayayi 這些靠 IP 走紅的企業,還有一派虛擬數字人企業,他們靠技術驅動。他們更在意推動虛擬數字人的實用化和智能化。
? ? ? ?打造“曦靈”數字人制作平臺的百度、推出超級QQ秀的騰訊,以及借助XR眼鏡打造虛擬人的杭州李未可公司都是這一派的典型。
? ? ? ?這些企業也有IP,但更在注重相關技術的研發,一方面希望縮短制作虛擬數字人的制作時長與難度,一方面讓虛擬人“飛入尋常消費者手中”。
? ? ? ?百度的曦靈就擁有3D寫實、2D寫實、3D卡通三條資產生產線,“2D的幾分鐘,3D的幾個小時生成”。李士巖表示,百度的跨模態生成技術,讓數字人的口型合成準確率達到98.5%。
? ? ? ?與百度的思路類似,目前騰訊有兩條業務線做虛擬數字人,一條是互娛事業群所做的超寫實數字人小諍,她的身份是“新華社數字記者”、“全球首位數字航天員”,同時騰訊也搭建了一條數字人制作管線 xFaceBuilder?,讓走超寫實路線的小諍誕生,僅僅花費了兩個半月時間。
? ? ? ?另一條線就是QQ正在推進的超級QQ秀,超級QQ秀的人物是動漫風格,通過組裝不同的發型、衣服等飾品,形成各種可愛的形象。不過從內測的情況看,如果用戶想DIY自己的面部、五官,以及衣服鞋子等,都需要付費。
? ? ? ?騰訊很有希望借助超級QQ秀,讓每個人都更早擁有自己的虛擬數字人。杭州李未可公司的夢想則更加遠大,茹憶希望通過顛覆式的XR眼鏡等方式,讓虛擬數字人作為“多啦A夢”的形式,成為未來大家都想擁有的伙伴。
? ? ? ?當然,阿里巴巴也沒有缺席這場盛宴。其達摩院也在探索虛擬數字人,阿里的XR實驗室的負責人譚平就曾表示,如今互聯網是二維交互,而虛擬人和虛擬世界所構成的元宇宙,就是三維交互。
03 和虛擬人做同事的日子來了?
? ? ? ?前有捉妖的“柳夜熙”,后有觀察人類的“李未可”,讓不少人感嘆的是,當虛擬人從聚光燈前走到日常工作中時,自己可能連虛擬人都競爭不過,比如萬科總部2021年度的優秀新人獎就頒發給了公司第一位數字員工崔筱盼。
? ? ? ?憑借神似真人的高顏值,崔筱盼在2021年2月初入職時就引得催賬部門一陣騷動。有員工表示,“之前有公司同事收到‘她’發的郵件時,就覺得這個姐姐好美,還想串部門去看真人來著。”
? ? ? ?出眾的外貌加上出色的工作能力,“虛擬人”崔筱盼火出圈了。萬科集團董事會主席郁亮在朋友圈里對其大加贊賞,“在系統算法的加持下,她很快學會了人在流程和數據中發現問題的方法,以高于人類千百倍的效率在各類應收、逾期提醒及工作異常偵測中大顯身手。她催辦的預付應收逾期單據核銷率達到91.44%。”
? ? ? ?對此,不少網友開始驚嘆,虛擬數字人已經在跟人類搶飯碗了,“珍惜和真人同事內卷的日子吧,他們至少還是個人”、“好家伙,優秀員工年終獎又能少發一份”、“我以后連搬磚的機會都沒了”……
? ? ? ?現如今,不僅僅是充當偶像與主播這種“遠在天邊”的角色,已有不少虛擬數字人走進了現實生活,成為許多人的同事、同學。像清華大學生“華智冰”、《快樂大本營》主持人“小漾”、新華社數字記者“小諍”以及冬奧會上全時無休的AI手語主播等。
? ? ? ?毫無防備,虛擬數字人就這樣出現在了每個人的身旁。
? ? ? ?“除了品牌方和直播電商井噴的需求外,一些政企也開始和我們合作了。例如,通過全息投影技術為浦發銀行打造的虛擬大堂經理。對于銀行而言,可能投入幾百萬的成本就可以直接取代一個真人崗位。”弘一說。而在目前的金融領域,也已有多家銀行推出虛擬數字員工,像浦發銀行的小浦、江南農商銀行的VTM、百信銀行的AIYA艾雅等。
? ? ? ?值得注意的是,2021年10月,廣電總局在《廣播電視和網絡視聽“十四五”科技發展規劃》中首次明確指出,要推動虛擬主播、動畫手語廣泛應用于新聞播報、天氣預報、綜藝科教等節目生產,創新節目形態,提高制播效率和智能化水平。
? ? ? ?據麥肯錫預測,到2030年,中國將至少有1.18億人被人工智能或機器人替代。不可否認,這些披著完美軀殼和未來想象的虛擬數字人并不僅僅局限于精神上的娛樂、社交及審美需求,一批具有更強功能性和服務性的“他們”正在替代真人。
04 萬億市場的冷與熱
? ? ? ?如今,毋庸置疑虛擬數字人的概念火了,市場被其未來的想象空間所鼓舞。
? ? ? ?“從目前報告看,基于互聯網的虛擬人市場空間是2700億元,而基于Web 3.0的虛擬數字人將到達萬億規模。”
? ? ? ?吳世春表示,目前虛擬數字人釋放的商業價值還比較淺。一份虛擬數字人代言合作,差不多是幾十萬到上百萬價位,行業內最高有三四百萬元的合作。未來更多商業與虛擬數字人結合,市場前景才更廣闊。
? ? ? ?比如,目前虛擬數字人在直播帶貨與品牌代言等領域的商業化剛剛開始,未來Web 3.0的元宇宙世界中,虛擬數字人的社交、電商、教育、游戲、支付等商業行為統統都會發生,也許很多商業模式都會發生變化。
? ? ? ?“我們用掌上12306買票(如今是網頁形式提供服務),在元宇宙的三維世界里,我相信它是數字人加上無數個視覺界面,為用戶既提供信息服務也提供溫暖的人情服務。”李士巖看好未來的數字人提供更立體的服務。
? ? ? ?在基于Web 3.0的虛擬數字人實踐中,燃麥科技的腳步也比較快。基于 Ayayi 的NFT品牌以及數字盲盒,都在試水。今年還會舉辦多媒體數字藝術展,這是燃麥為虛擬IP策劃的重要發力方向。
? ? ? ?“Web 3.0 讓數字資產更具有意義,”在唐迤看來,虛擬數字人需要跨過這一步,才真正的具備現實價值。這也是虛擬數字人不會走向線下,如同玲娜貝兒向實體發展的原因,一個未來的大門已經被打開,復制IP走迪士尼的老路,不是大家看重的遠方。
? ? ? ?當然 ,盡管虛擬數字人展示了無限的想象力,卻也面臨眾多發展的桎梏與挑戰。
? ? ? ?比如在數字人表情方面,就有一道“恐怖谷”(虛擬人表情不真實就有僵尸的感覺)。虛擬人實時互動反饋表情這一項,各家巨頭都處在初級階段,創業公司基本還不具備這項能力。
? ? ? ?另一方面,就是成本與效率的最佳化,這一方面巨頭走的是中臺化路徑。在李士巖看來,中臺不僅是快速制作虛擬數字人,更是輸出智能化模塊,讓數字人學習智能對話與商業知識的最佳路徑。
? ? ? ?與此同時,虛擬數字人所帶來的發展挑戰也被重視。
? ? ? ?如今,“虛擬人是否會侵占更多的勞動力市場,和人類搶飯碗?”就在網絡上被熱議,尤其在萬科集團2021年度最佳新人獎,頒給了一位數字人“崔筱盼”后,這種聲音就更多了起來。
? ? ? ?崔筱盼是位財稅數字人,永遠不知疲倦,永遠熱情待人,也因此擁有普通人難以企及的工作業績。不止崔筱盼,如今在各個領域,都在涌現虛擬數字員工,這些數字員工也正在讓職場更加內卷。
? ? ? ?另一方面,Web 3.0時期的數字人,則在帶來更加未知的挑戰。如何避免違規和炒作的現象,也需要行業的進步與市場的監督。
? ? ? ?如論如何,虛擬數字人正向我們走來,或許也正在定義未來。
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?來源:賢集網
掃一掃關注我們
物端AI芯片??
邊緣AI計算設備?高通量AI服務器認知智能與協作計算