回顧人類發(fā)展的歷史長河,自18世紀(jì)以來,大約每隔一百年,都會經(jīng)歷一次“革命”。歷史上三次工業(yè)革命先后把人類帶入三個時代——蒸汽時代、電氣時代和信息時代。

第三次工業(yè)革命的領(lǐng)軍人物比爾?蓋茨認(rèn)為,以人工智能為代表的第四次工業(yè)革命會給許多領(lǐng)域帶來顛覆性變化。5G通信技術(shù)和通用人工智能技術(shù)是實現(xiàn)萬物互聯(lián)和萬物智能的關(guān)鍵,人類也將因此進入智能時代。

順應(yīng)趨勢,才能領(lǐng)跑時代。2024年全國兩會對于“人工智能+”的討論,不僅展示了人工智能技術(shù)的廣闊應(yīng)用前景,也體現(xiàn)了國家對于推動智能化發(fā)展、構(gòu)建智能化產(chǎn)業(yè)體系的堅定決心。


數(shù)字人的發(fā)展沿革

人工智能、虛擬現(xiàn)實、人機交互等技術(shù)不斷發(fā)展,使得元宇宙的愿景越來越清晰,人們不禁暢想在未來存在一個和真實世界平行的虛擬世界,即使足不出戶,也可以由“數(shù)字分身” 在元宇宙中實現(xiàn)出行、社交、娛樂、購物和學(xué)習(xí)等體驗,因此數(shù)字人技術(shù)如同不可阻擋的洋流,推動各行業(yè)的深刻變革。兩會期間,人民網(wǎng)、央視財經(jīng)等主流媒體推出“兩會AI數(shù)字主持人”就令人眼前一亮,為大眾帶來全新的交互體驗。

數(shù)字人(Digital Human / Meta Human),是指運用計算機技術(shù)和人工智能技術(shù)創(chuàng)建的虛擬人物或數(shù)字化人格,旨在復(fù)制人類的行為和人格特征。數(shù)字人可以理解為將人類的外貌特征和動作表現(xiàn)轉(zhuǎn)換成數(shù)字化模型,從而可以在虛擬世界中實現(xiàn)人物模擬。

在平常的觀感上,數(shù)字人是整合了人物形象模擬、人物聲音克隆、自然語言處理、知識圖譜解析等眾多世界領(lǐng)先的人工智能技術(shù)的可視化虛擬數(shù)字人。通過對人物形象的復(fù)制模擬,人物聲音的克隆及語音合成,可隨時隨地與真人進行準(zhǔn)確的交互性對話。

1.jpg

通俗來講,數(shù)字人本質(zhì)上是AI的一種進化,是通過計算機圖形學(xué)技術(shù)進行虛擬制作的類人形象,沒有現(xiàn)實世界中的身體。數(shù)字人的本體存在于計算設(shè)備中(比如電腦、手機),可通過顯示設(shè)備呈現(xiàn)出來,讓人類用眼睛看見。數(shù)字人具備人類的外觀和行為模式,也具有人類身體的外觀形體結(jié)構(gòu),表現(xiàn)出的行為模式與人類相仿,數(shù)字人的影像也通常呈現(xiàn)出人類的某種活動。數(shù)字人技術(shù)的發(fā)展歷史可以追溯到計算機科學(xué)和人工智能的早期階段。

1. 三維建模階段(1990年代)

2.jpg

在數(shù)字人技術(shù)的早期階段,研究人員主要采用三維建模技術(shù)來實現(xiàn)數(shù)字人的創(chuàng)建。這種方法需要專業(yè)的3D建模師手工制作數(shù)字人的外貌特征和骨骼結(jié)構(gòu),然后將其導(dǎo)入到游戲或電影等應(yīng)用場景中。

3.jpg

圖片來源:深度人工智能

2. 動作捕捉階段(2000年代)

4.jpg

為了讓數(shù)字人表現(xiàn)出更真實的情感和表情,人們開始研究面部表情捕捉技術(shù)。隨著動作捕捉技術(shù)的發(fā)展,數(shù)字人的創(chuàng)建開始更加注重動作表現(xiàn)的逼真性。這種方法利用傳感器捕捉真實人物的動作數(shù)據(jù),然后將其應(yīng)用到數(shù)字人模型上,使其能夠以逼真的方式呈現(xiàn)出各種動作和表情。

5.jpg

圖片來源:VR大空間

3. 深度學(xué)習(xí)階段(2010年代至今)

隨著深度學(xué)習(xí)技術(shù)的發(fā)展,數(shù)字人的創(chuàng)建開始更加注重對細(xì)節(jié)的還原和真實感的提升。目前,人們正在研究使用深度神經(jīng)網(wǎng)絡(luò)生成數(shù)字人的技術(shù)。這種技術(shù)可以生成更加真實的數(shù)字人,并且可以根據(jù)用戶的需求進行自適應(yīng)和個性化。

這種利用深度學(xué)習(xí)算法模型訓(xùn)練的方法,能夠自動生成逼真的數(shù)字人模型。同時,這種方法還可以通過將多個模型結(jié)合起來,實現(xiàn)更加復(fù)雜的數(shù)字人模擬。

我國數(shù)字人發(fā)展歷程

在2001年和2003年兩次香山科學(xué)會議后,中國啟動了數(shù)字人領(lǐng)域的研究計劃。從2002年構(gòu)建中國男、女首批數(shù)據(jù)集開始,現(xiàn)已完成8套能代表中華民族特色的數(shù)據(jù)集。2023年6月9日,中國科學(xué)院古脊椎動物與古人類研究所、周口店遺址博物館與北京文博遠(yuǎn)大數(shù)字技術(shù)有限公司合作,利用AIGC技術(shù)設(shè)計出中國首個古人類“數(shù)字人”。

6.jpg

數(shù)字北京人圖片來源:BTV新聞頻道

2023年7月27日,中國首個國家級數(shù)字人專業(yè)委員會開始籌備。2023年8月9日,中國國內(nèi)首個數(shù)字人存證備案的完整案例在中國數(shù)字人知識產(chǎn)權(quán)存證保護平臺備案完成。2023年9月,中國信通院發(fā)布最新的數(shù)字人標(biāo)準(zhǔn)符合性驗證結(jié)果,螞蟻集團的靈境數(shù)字人平臺,成為業(yè)界首個通過金融數(shù)字人評測的產(chǎn)品,前文提到的兩會AI數(shù)字主持人就是在螞蟻靈境數(shù)字人平臺提供的技術(shù)支持下打造出來的。


探索藍(lán)海,誰是實力派?

當(dāng)前階段,虛擬數(shù)字人無疑是元宇宙概念下最受重視、投入最大、落地最快的領(lǐng)域之一。僅2021年,國內(nèi)就有20家以上的數(shù)字人企業(yè)獲得新一輪融資,且規(guī)模都在數(shù)千萬元人民幣以上。到了2022年,數(shù)字人更是幾乎成為AI第一熱門賽道,在諸多應(yīng)用場景大放光彩。

目前國內(nèi)市場涌現(xiàn)的數(shù)字人平臺中,科大訊飛數(shù)字人、小冰數(shù)字人、硅基智能、風(fēng)平智能、智影、閃剪、元分身、奇妙元、配播和花臉數(shù)字人等都是備受關(guān)注的代表。它們各自具備獨特的技術(shù)實力和創(chuàng)新特點,在數(shù)字人逼真程度、安全性和用戶體驗等方面有所差異。

7.jpg

在技術(shù)實力方面,科大訊飛、小冰、硅基智能、風(fēng)平智能、騰訊智影等平臺具備較強的技術(shù)實力,能夠?qū)崿F(xiàn)高度逼真的數(shù)字人形象和動作表現(xiàn);在安全性方面,科大訊飛、小冰、硅基智能和風(fēng)平智能、智影等平臺通過采用加密技術(shù)和安全協(xié)議等手段來保護用戶數(shù)據(jù)的安全,為用戶提供可靠的數(shù)字人服務(wù),其他未公布安全性的平臺在選擇時則需要考慮其安全隱私是否能滿足自身需求;在數(shù)字人逼真程度方面,這些平臺均注重數(shù)字人的逼真表現(xiàn),能夠給觀眾帶來沉浸式的體驗。


數(shù)字人“走進”金融行業(yè)

據(jù)零壹財經(jīng)統(tǒng)計數(shù)據(jù)顯示,近年來已有20多家銀行、消費金融、投資咨詢公司、保險公司等機構(gòu)的“數(shù)字員工”正式上崗。部分機構(gòu)的數(shù)字人還會提供投資顧問、保險代理、經(jīng)紀(jì)等服務(wù),虛擬數(shù)字人已從實驗室走進現(xiàn)實,逐漸應(yīng)用于商業(yè)化金融場景。

在財富管理轉(zhuǎn)型背景下,投顧業(yè)務(wù)作為金融機構(gòu)對接客戶的抓手變得愈發(fā)重要。最新數(shù)據(jù)顯示,中國目前有7.9萬名投資顧問人員服務(wù)約2.18億投資者,每位證券投資顧問服務(wù)客戶數(shù)為2750人。在中國證券市場上,自從投資顧問群體出現(xiàn),就一直存在投資顧問服務(wù)客戶數(shù)過多的難題。

“肯定服務(wù)不過來,拋開資產(chǎn)規(guī)模不說,個人覺得一位投資顧問最多服務(wù)50位投資者已經(jīng)是極限了?!比A南一家上市券商投顧業(yè)務(wù)負(fù)責(zé)人說。投資顧問在超負(fù)荷覆蓋龐大客戶群體下,難以深入了解客戶,精細(xì)化服務(wù)更是無從談起。

無論從政策端還是業(yè)務(wù)端考量,“買方投顧”時代已然到來。如何滿足投資者千人千面的需求,如何從“產(chǎn)品為王”向“服務(wù)為王”、“專業(yè)為王”過渡,成為業(yè)內(nèi)機構(gòu)的新探索與差異化發(fā)展方向。居民財富快速增長,投顧轉(zhuǎn)型大勢所趨,大模型賦能機構(gòu)實現(xiàn)降本增效,智能投顧數(shù)字人的研發(fā)需求應(yīng)運而生。


順應(yīng)趨勢,第一個“吃螃蟹”——九方智能投顧數(shù)字人

作為中國領(lǐng)先的在線投資決策解決方案提供商,九方財富(09636.HK)旗下核心業(yè)務(wù)子公司上海九方云智能科技有限公司(以下簡稱“九方智投”)從2019年便開始圍繞“數(shù)智化”轉(zhuǎn)型不斷發(fā)力,憑借其多年證券行業(yè)數(shù)據(jù)積淀與金融科技研發(fā)積累,攜手華為云和科大訊飛,推出業(yè)內(nèi)首款證券投資數(shù)字人產(chǎn)品——九方智能投顧數(shù)字人“九哥”。

集百余位科研技術(shù)人員之力,耗時兩年才研發(fā)而成的“九哥”是一款通過智能交互技術(shù),對真人進行虛擬仿真的數(shù)字人系統(tǒng),其內(nèi)核依托于九方自研的“九章證券領(lǐng)域大模型”,可通過互動對話的形式為用戶解答各類證券投資問題。

九方智能投顧數(shù)字人搭建了宏觀政策、經(jīng)濟數(shù)據(jù)、行情數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、研究報告、資訊新聞、公司公告、法律法規(guī)八大特色數(shù)據(jù)庫,如同構(gòu)建了一個包羅萬象的“全能大腦”,可以在不同的指令場景下,從多維度出發(fā),分析用戶潛在的投資機會及潛在風(fēng)險,從而幫助投資者作出更加科學(xué)的投資決策。

九方智能投顧數(shù)字人“九哥”擁有大盤分析、板塊挖掘、熱點追蹤、策略生成、金融百科、個股診斷、事件推理、情緒陪伴八大核心能力。

8.jpg

圖片來源:九方智投

在AIGC的賦能下,“九哥“還有更加智能的交互對話系統(tǒng),相較于普通的問答機器人,它更像是一位貼心的投資顧問,既能多方位解析用戶問題并提供專業(yè)的技術(shù)支持,又能精準(zhǔn)識別用戶意圖且恰到好處地提供情緒價值,從維度、廣度、深度等角度構(gòu)建與投資者的連接。九方智投還利用知識圖譜技術(shù)、事件與因果關(guān)系抽取技術(shù),構(gòu)建智能投顧數(shù)字人的金融產(chǎn)業(yè)鏈圖譜與事理圖譜,助力數(shù)字人進行產(chǎn)業(yè)資訊分析及市場投資邏輯推理。

九方智能投顧數(shù)字人也是業(yè)內(nèi)首創(chuàng)金融診股類數(shù)字人產(chǎn)品,可實現(xiàn)1對1互動診股,專注于投顧服務(wù)場景,將先進的AI技術(shù)和專業(yè)的投資理念相結(jié)合,“九哥”已可以在一定程度上扮演專業(yè)人類投顧的角色,為投資者提供智能高效的陪伴式服務(wù)。

身處人工智能大變局,每一項業(yè)務(wù)都要以科技的手段再造。智能投顧作為一種創(chuàng)新的金融服務(wù)模式,利用人機交互技術(shù)為投資者提供更加便捷、高效、低成本的投資服務(wù),讓投資理財更加智能化、普惠化。

九方智能投顧數(shù)字人的出現(xiàn),打破了傳統(tǒng)真人投資顧問服務(wù)的時間和空間限制,通過人機交互技術(shù),投資者可以隨時隨地通過九方智投APP獲得投資建議,不再需要預(yù)約和等待,真正意義上實現(xiàn)了全年無休,7天24小時的全方位陪伴。

智能投顧數(shù)字人的亮相是投顧行業(yè)在金融科技探索路程上的里程碑,有望在未來助力整個金融行業(yè)數(shù)字化、智能化轉(zhuǎn)型,為各金融細(xì)分領(lǐng)域的投資者提供更加智能化和個性化的服務(wù),為中國數(shù)字經(jīng)濟高質(zhì)量發(fā)展貢獻綿薄之力。


數(shù)字人技術(shù)的發(fā)散思考

當(dāng)前虛擬數(shù)字人理論和技術(shù)日益成熟,應(yīng)用范圍不斷擴大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應(yīng)的商業(yè)模式也在持續(xù)演進和多元化。

9.jpg

圖片來源:微盟運營中心

關(guān)于虛擬數(shù)字人的發(fā)展層次,華院計算認(rèn)為有三重境界。第一層,能說會動,指的是數(shù)字人具備特定的相貌,可以用語言、動作進行表達;第二層,真情實感,是讓數(shù)字人成為一個具備性格特征的獨特個體,并且具有情感表達的能力;第三層,能思會想,數(shù)字人能感知其內(nèi)部世界,形成主動學(xué)習(xí)和持續(xù)學(xué)習(xí)的能力。

10.jpg

圖片來源:華院計算

但目前,大多數(shù)虛擬數(shù)字人雖然擁有逼真的外觀和肢體動作,但它們對語言理解還是以文本為主,常規(guī)反應(yīng)也主要靠基礎(chǔ)設(shè)定。

以最近2024年商湯科技年會為例,為了緬懷去年12月逝世的創(chuàng)始人湯曉鷗教授,商湯科技采用先進的技術(shù)為大家?guī)砹艘粓隹缭綍r空的重逢。

其年會視頻中我們看到了湯老師這位“數(shù)字人“進行喝水、低頭以及一些手部動作,甚至連湯老師講話間隙的咳嗽、停頓也都被還原了出來。此刻,數(shù)字人技術(shù)似乎不再是冰冷的代碼,它想要探索第二重境界,用情感表達它是AI,也是愛。

11.jpg

圖片來源:商湯科技年會

但回歸現(xiàn)實,雖然大模型、大數(shù)據(jù)的驅(qū)動讓人工智能在對話的自然度、趣味性上有了很大突破,但距離情感表達、主動學(xué)習(xí)、自主意識等還有很遠(yuǎn)的距離。未來多模態(tài)AI技術(shù)將成為數(shù)字人發(fā)展的最大推動力,該技術(shù)的引入將幫助數(shù)字人從基于文本的交互,轉(zhuǎn)化為基于語義的交互,強化其對情緒的感知和情感表達,使得數(shù)字人交互更像人類,并逐步覆蓋其全流程。


也許隨著技術(shù)發(fā)展,有一天當(dāng)你對數(shù)字人說你很疲憊,而數(shù)字人聯(lián)想到人類喝咖啡可能會有精神,那下次當(dāng)它感知到人類疲憊時,說不定能為人類煮一杯咖啡呢?



人已收藏

相關(guān)文章

評論列表(已有條評論)

最新評論