回顧人類發(fā)展的歷史長(zhǎng)河,自18世紀(jì)以來(lái),大約每隔一百年,都會(huì)經(jīng)歷一次“革命”。歷史上三次工業(yè)革命先后把人類帶入三個(gè)時(shí)代——蒸汽時(shí)代、電氣時(shí)代和信息時(shí)代。
第三次工業(yè)革命的領(lǐng)軍人物比爾?蓋茨認(rèn)為,以人工智能為代表的第四次工業(yè)革命會(huì)給許多領(lǐng)域帶來(lái)顛覆性變化。5G通信技術(shù)和通用人工智能技術(shù)是實(shí)現(xiàn)萬(wàn)物互聯(lián)和萬(wàn)物智能的關(guān)鍵,人類也將因此進(jìn)入智能時(shí)代。
順應(yīng)趨勢(shì),才能領(lǐng)跑時(shí)代。2024年全國(guó)兩會(huì)對(duì)于“人工智能+”的討論,不僅展示了人工智能技術(shù)的廣闊應(yīng)用前景,也體現(xiàn)了國(guó)家對(duì)于推動(dòng)智能化發(fā)展、構(gòu)建智能化產(chǎn)業(yè)體系的堅(jiān)定決心。
數(shù)字人的發(fā)展沿革
人工智能、虛擬現(xiàn)實(shí)、人機(jī)交互等技術(shù)不斷發(fā)展,使得元宇宙的愿景越來(lái)越清晰,人們不禁暢想在未來(lái)存在一個(gè)和真實(shí)世界平行的虛擬世界,即使足不出戶,也可以由“數(shù)字分身” 在元宇宙中實(shí)現(xiàn)出行、社交、娛樂(lè)、購(gòu)物和學(xué)習(xí)等體驗(yàn),因此數(shù)字人技術(shù)如同不可阻擋的洋流,推動(dòng)各行業(yè)的深刻變革。兩會(huì)期間,人民網(wǎng)、央視財(cái)經(jīng)等主流媒體推出“兩會(huì)AI數(shù)字主持人”就令人眼前一亮,為大眾帶來(lái)全新的交互體驗(yàn)。
數(shù)字人(Digital Human / Meta Human),是指運(yùn)用計(jì)算機(jī)技術(shù)和人工智能技術(shù)創(chuàng)建的虛擬人物或數(shù)字化人格,旨在復(fù)制人類的行為和人格特征。數(shù)字人可以理解為將人類的外貌特征和動(dòng)作表現(xiàn)轉(zhuǎn)換成數(shù)字化模型,從而可以在虛擬世界中實(shí)現(xiàn)人物模擬。
在平常的觀感上,數(shù)字人是整合了人物形象模擬、人物聲音克隆、自然語(yǔ)言處理、知識(shí)圖譜解析等眾多世界領(lǐng)先的人工智能技術(shù)的可視化虛擬數(shù)字人。通過(guò)對(duì)人物形象的復(fù)制模擬,人物聲音的克隆及語(yǔ)音合成,可隨時(shí)隨地與真人進(jìn)行準(zhǔn)確的交互性對(duì)話。
通俗來(lái)講,數(shù)字人本質(zhì)上是AI的一種進(jìn)化,是通過(guò)計(jì)算機(jī)圖形學(xué)技術(shù)進(jìn)行虛擬制作的類人形象,沒(méi)有現(xiàn)實(shí)世界中的身體。數(shù)字人的本體存在于計(jì)算設(shè)備中(比如電腦、手機(jī)),可通過(guò)顯示設(shè)備呈現(xiàn)出來(lái),讓人類用眼睛看見(jiàn)。數(shù)字人具備人類的外觀和行為模式,也具有人類身體的外觀形體結(jié)構(gòu),表現(xiàn)出的行為模式與人類相仿,數(shù)字人的影像也通常呈現(xiàn)出人類的某種活動(dòng)。數(shù)字人技術(shù)的發(fā)展歷史可以追溯到計(jì)算機(jī)科學(xué)和人工智能的早期階段。
1. 三維建模階段(1990年代)
在數(shù)字人技術(shù)的早期階段,研究人員主要采用三維建模技術(shù)來(lái)實(shí)現(xiàn)數(shù)字人的創(chuàng)建。這種方法需要專業(yè)的3D建模師手工制作數(shù)字人的外貌特征和骨骼結(jié)構(gòu),然后將其導(dǎo)入到游戲或電影等應(yīng)用場(chǎng)景中。
圖片來(lái)源:深度人工智能
2. 動(dòng)作捕捉階段(2000年代)
為了讓數(shù)字人表現(xiàn)出更真實(shí)的情感和表情,人們開(kāi)始研究面部表情捕捉技術(shù)。隨著動(dòng)作捕捉技術(shù)的發(fā)展,數(shù)字人的創(chuàng)建開(kāi)始更加注重動(dòng)作表現(xiàn)的逼真性。這種方法利用傳感器捕捉真實(shí)人物的動(dòng)作數(shù)據(jù),然后將其應(yīng)用到數(shù)字人模型上,使其能夠以逼真的方式呈現(xiàn)出各種動(dòng)作和表情。
圖片來(lái)源:VR大空間
3. 深度學(xué)習(xí)階段(2010年代至今)
隨著深度學(xué)習(xí)技術(shù)的發(fā)展,數(shù)字人的創(chuàng)建開(kāi)始更加注重對(duì)細(xì)節(jié)的還原和真實(shí)感的提升。目前,人們正在研究使用深度神經(jīng)網(wǎng)絡(luò)生成數(shù)字人的技術(shù)。這種技術(shù)可以生成更加真實(shí)的數(shù)字人,并且可以根據(jù)用戶的需求進(jìn)行自適應(yīng)和個(gè)性化。
這種利用深度學(xué)習(xí)算法模型訓(xùn)練的方法,能夠自動(dòng)生成逼真的數(shù)字人模型。同時(shí),這種方法還可以通過(guò)將多個(gè)模型結(jié)合起來(lái),實(shí)現(xiàn)更加復(fù)雜的數(shù)字人模擬。
我國(guó)數(shù)字人發(fā)展歷程
在2001年和2003年兩次香山科學(xué)會(huì)議后,中國(guó)啟動(dòng)了數(shù)字人領(lǐng)域的研究計(jì)劃。從2002年構(gòu)建中國(guó)男、女首批數(shù)據(jù)集開(kāi)始,現(xiàn)已完成8套能代表中華民族特色的數(shù)據(jù)集。2023年6月9日,中國(guó)科學(xué)院古脊椎動(dòng)物與古人類研究所、周口店遺址博物館與北京文博遠(yuǎn)大數(shù)字技術(shù)有限公司合作,利用AIGC技術(shù)設(shè)計(jì)出中國(guó)首個(gè)古人類“數(shù)字人”。
數(shù)字北京人圖片來(lái)源:BTV新聞?lì)l道
2023年7月27日,中國(guó)首個(gè)國(guó)家級(jí)數(shù)字人專業(yè)委員會(huì)開(kāi)始籌備。2023年8月9日,中國(guó)國(guó)內(nèi)首個(gè)數(shù)字人存證備案的完整案例在中國(guó)數(shù)字人知識(shí)產(chǎn)權(quán)存證保護(hù)平臺(tái)備案完成。2023年9月,中國(guó)信通院發(fā)布最新的數(shù)字人標(biāo)準(zhǔn)符合性驗(yàn)證結(jié)果,螞蟻集團(tuán)的靈境數(shù)字人平臺(tái),成為業(yè)界首個(gè)通過(guò)金融數(shù)字人評(píng)測(cè)的產(chǎn)品,前文提到的兩會(huì)AI數(shù)字主持人就是在螞蟻靈境數(shù)字人平臺(tái)提供的技術(shù)支持下打造出來(lái)的。
探索藍(lán)海,誰(shuí)是實(shí)力派?
當(dāng)前階段,虛擬數(shù)字人無(wú)疑是元宇宙概念下最受重視、投入最大、落地最快的領(lǐng)域之一。僅2021年,國(guó)內(nèi)就有20家以上的數(shù)字人企業(yè)獲得新一輪融資,且規(guī)模都在數(shù)千萬(wàn)元人民幣以上。到了2022年,數(shù)字人更是幾乎成為AI第一熱門賽道,在諸多應(yīng)用場(chǎng)景大放光彩。
目前國(guó)內(nèi)市場(chǎng)涌現(xiàn)的數(shù)字人平臺(tái)中,科大訊飛數(shù)字人、小冰數(shù)字人、硅基智能、風(fēng)平智能、智影、閃剪、元分身、奇妙元、配播和花臉數(shù)字人等都是備受關(guān)注的代表。它們各自具備獨(dú)特的技術(shù)實(shí)力和創(chuàng)新特點(diǎn),在數(shù)字人逼真程度、安全性和用戶體驗(yàn)等方面有所差異。
在技術(shù)實(shí)力方面,科大訊飛、小冰、硅基智能、風(fēng)平智能、騰訊智影等平臺(tái)具備較強(qiáng)的技術(shù)實(shí)力,能夠?qū)崿F(xiàn)高度逼真的數(shù)字人形象和動(dòng)作表現(xiàn);在安全性方面,科大訊飛、小冰、硅基智能和風(fēng)平智能、智影等平臺(tái)通過(guò)采用加密技術(shù)和安全協(xié)議等手段來(lái)保護(hù)用戶數(shù)據(jù)的安全,為用戶提供可靠的數(shù)字人服務(wù),其他未公布安全性的平臺(tái)在選擇時(shí)則需要考慮其安全隱私是否能滿足自身需求;在數(shù)字人逼真程度方面,這些平臺(tái)均注重?cái)?shù)字人的逼真表現(xiàn),能夠給觀眾帶來(lái)沉浸式的體驗(yàn)。
數(shù)字人“走進(jìn)”金融行業(yè)
據(jù)零壹財(cái)經(jīng)統(tǒng)計(jì)數(shù)據(jù)顯示,近年來(lái)已有20多家銀行、消費(fèi)金融、投資咨詢公司、保險(xiǎn)公司等機(jī)構(gòu)的“數(shù)字員工”正式上崗。部分機(jī)構(gòu)的數(shù)字人還會(huì)提供投資顧問(wèn)、保險(xiǎn)代理、經(jīng)紀(jì)等服務(wù),虛擬數(shù)字人已從實(shí)驗(yàn)室走進(jìn)現(xiàn)實(shí),逐漸應(yīng)用于商業(yè)化金融場(chǎng)景。
在財(cái)富管理轉(zhuǎn)型背景下,投顧業(yè)務(wù)作為金融機(jī)構(gòu)對(duì)接客戶的抓手變得愈發(fā)重要。最新數(shù)據(jù)顯示,中國(guó)目前有7.9萬(wàn)名投資顧問(wèn)人員服務(wù)約2.18億投資者,每位證券投資顧問(wèn)服務(wù)客戶數(shù)為2750人。在中國(guó)證券市場(chǎng)上,自從投資顧問(wèn)群體出現(xiàn),就一直存在投資顧問(wèn)服務(wù)客戶數(shù)過(guò)多的難題。
“肯定服務(wù)不過(guò)來(lái),拋開(kāi)資產(chǎn)規(guī)模不說(shuō),個(gè)人覺(jué)得一位投資顧問(wèn)最多服務(wù)50位投資者已經(jīng)是極限了?!比A南一家上市券商投顧業(yè)務(wù)負(fù)責(zé)人說(shuō)。投資顧問(wèn)在超負(fù)荷覆蓋龐大客戶群體下,難以深入了解客戶,精細(xì)化服務(wù)更是無(wú)從談起。
無(wú)論從政策端還是業(yè)務(wù)端考量,“買方投顧”時(shí)代已然到來(lái)。如何滿足投資者千人千面的需求,如何從“產(chǎn)品為王”向“服務(wù)為王”、“專業(yè)為王”過(guò)渡,成為業(yè)內(nèi)機(jī)構(gòu)的新探索與差異化發(fā)展方向。居民財(cái)富快速增長(zhǎng),投顧轉(zhuǎn)型大勢(shì)所趨,大模型賦能機(jī)構(gòu)實(shí)現(xiàn)降本增效,智能投顧數(shù)字人的研發(fā)需求應(yīng)運(yùn)而生。
順應(yīng)趨勢(shì),第一個(gè)“吃螃蟹”——九方智能投顧數(shù)字人
作為中國(guó)領(lǐng)先的在線投資決策解決方案提供商,九方財(cái)富(09636.HK)旗下核心業(yè)務(wù)子公司上海九方云智能科技有限公司(以下簡(jiǎn)稱“九方智投”)從2019年便開(kāi)始圍繞“數(shù)智化”轉(zhuǎn)型不斷發(fā)力,憑借其多年證券行業(yè)數(shù)據(jù)積淀與金融科技研發(fā)積累,攜手華為云和科大訊飛,推出業(yè)內(nèi)首款證券投資數(shù)字人產(chǎn)品——九方智能投顧數(shù)字人“九哥”。
集百余位科研技術(shù)人員之力,耗時(shí)兩年才研發(fā)而成的“九哥”是一款通過(guò)智能交互技術(shù),對(duì)真人進(jìn)行虛擬仿真的數(shù)字人系統(tǒng),其內(nèi)核依托于九方自研的“九章證券領(lǐng)域大模型”,可通過(guò)互動(dòng)對(duì)話的形式為用戶解答各類證券投資問(wèn)題。
九方智能投顧數(shù)字人搭建了宏觀政策、經(jīng)濟(jì)數(shù)據(jù)、行情數(shù)據(jù)、業(yè)務(wù)數(shù)據(jù)、研究報(bào)告、資訊新聞、公司公告、法律法規(guī)八大特色數(shù)據(jù)庫(kù),如同構(gòu)建了一個(gè)包羅萬(wàn)象的“全能大腦”,可以在不同的指令場(chǎng)景下,從多維度出發(fā),分析用戶潛在的投資機(jī)會(huì)及潛在風(fēng)險(xiǎn),從而幫助投資者作出更加科學(xué)的投資決策。
九方智能投顧數(shù)字人“九哥”擁有大盤(pán)分析、板塊挖掘、熱點(diǎn)追蹤、策略生成、金融百科、個(gè)股診斷、事件推理、情緒陪伴八大核心能力。
圖片來(lái)源:九方智投
在AIGC的賦能下,“九哥“還有更加智能的交互對(duì)話系統(tǒng),相較于普通的問(wèn)答機(jī)器人,它更像是一位貼心的投資顧問(wèn),既能多方位解析用戶問(wèn)題并提供專業(yè)的技術(shù)支持,又能精準(zhǔn)識(shí)別用戶意圖且恰到好處地提供情緒價(jià)值,從維度、廣度、深度等角度構(gòu)建與投資者的連接。九方智投還利用知識(shí)圖譜技術(shù)、事件與因果關(guān)系抽取技術(shù),構(gòu)建智能投顧數(shù)字人的金融產(chǎn)業(yè)鏈圖譜與事理圖譜,助力數(shù)字人進(jìn)行產(chǎn)業(yè)資訊分析及市場(chǎng)投資邏輯推理。
九方智能投顧數(shù)字人也是業(yè)內(nèi)首創(chuàng)金融診股類數(shù)字人產(chǎn)品,可實(shí)現(xiàn)1對(duì)1互動(dòng)診股,專注于投顧服務(wù)場(chǎng)景,將先進(jìn)的AI技術(shù)和專業(yè)的投資理念相結(jié)合,“九哥”已可以在一定程度上扮演專業(yè)人類投顧的角色,為投資者提供智能高效的陪伴式服務(wù)。
身處人工智能大變局,每一項(xiàng)業(yè)務(wù)都要以科技的手段再造。智能投顧作為一種創(chuàng)新的金融服務(wù)模式,利用人機(jī)交互技術(shù)為投資者提供更加便捷、高效、低成本的投資服務(wù),讓投資理財(cái)更加智能化、普惠化。
九方智能投顧數(shù)字人的出現(xiàn),打破了傳統(tǒng)真人投資顧問(wèn)服務(wù)的時(shí)間和空間限制,通過(guò)人機(jī)交互技術(shù),投資者可以隨時(shí)隨地通過(guò)九方智投APP獲得投資建議,不再需要預(yù)約和等待,真正意義上實(shí)現(xiàn)了全年無(wú)休,7天24小時(shí)的全方位陪伴。
智能投顧數(shù)字人的亮相是投顧行業(yè)在金融科技探索路程上的里程碑,有望在未來(lái)助力整個(gè)金融行業(yè)數(shù)字化、智能化轉(zhuǎn)型,為各金融細(xì)分領(lǐng)域的投資者提供更加智能化和個(gè)性化的服務(wù),為中國(guó)數(shù)字經(jīng)濟(jì)高質(zhì)量發(fā)展貢獻(xiàn)綿薄之力。
數(shù)字人技術(shù)的發(fā)散思考
當(dāng)前虛擬數(shù)字人理論和技術(shù)日益成熟,應(yīng)用范圍不斷擴(kuò)大,產(chǎn)業(yè)正在逐步形成、不斷豐富,相應(yīng)的商業(yè)模式也在持續(xù)演進(jìn)和多元化。
圖片來(lái)源:微盟運(yùn)營(yíng)中心
關(guān)于虛擬數(shù)字人的發(fā)展層次,華院計(jì)算認(rèn)為有三重境界。第一層,能說(shuō)會(huì)動(dòng),指的是數(shù)字人具備特定的相貌,可以用語(yǔ)言、動(dòng)作進(jìn)行表達(dá);第二層,真情實(shí)感,是讓數(shù)字人成為一個(gè)具備性格特征的獨(dú)特個(gè)體,并且具有情感表達(dá)的能力;第三層,能思會(huì)想,數(shù)字人能感知其內(nèi)部世界,形成主動(dòng)學(xué)習(xí)和持續(xù)學(xué)習(xí)的能力。
圖片來(lái)源:華院計(jì)算
但目前,大多數(shù)虛擬數(shù)字人雖然擁有逼真的外觀和肢體動(dòng)作,但它們對(duì)語(yǔ)言理解還是以文本為主,常規(guī)反應(yīng)也主要靠基礎(chǔ)設(shè)定。
以最近2024年商湯科技年會(huì)為例,為了緬懷去年12月逝世的創(chuàng)始人湯曉鷗教授,商湯科技采用先進(jìn)的技術(shù)為大家?guī)?lái)了一場(chǎng)跨越時(shí)空的重逢。
其年會(huì)視頻中我們看到了湯老師這位“數(shù)字人“進(jìn)行喝水、低頭以及一些手部動(dòng)作,甚至連湯老師講話間隙的咳嗽、停頓也都被還原了出來(lái)。此刻,數(shù)字人技術(shù)似乎不再是冰冷的代碼,它想要探索第二重境界,用情感表達(dá)它是AI,也是愛(ài)。
圖片來(lái)源:商湯科技年會(huì)
但回歸現(xiàn)實(shí),雖然大模型、大數(shù)據(jù)的驅(qū)動(dòng)讓人工智能在對(duì)話的自然度、趣味性上有了很大突破,但距離情感表達(dá)、主動(dòng)學(xué)習(xí)、自主意識(shí)等還有很遠(yuǎn)的距離。未來(lái)多模態(tài)AI技術(shù)將成為數(shù)字人發(fā)展的最大推動(dòng)力,該技術(shù)的引入將幫助數(shù)字人從基于文本的交互,轉(zhuǎn)化為基于語(yǔ)義的交互,強(qiáng)化其對(duì)情緒的感知和情感表達(dá),使得數(shù)字人交互更像人類,并逐步覆蓋其全流程。
也許隨著技術(shù)發(fā)展,有一天當(dāng)你對(duì)數(shù)字人說(shuō)你很疲憊,而數(shù)字人聯(lián)想到人類喝咖啡可能會(huì)有精神,那下次當(dāng)它感知到人類疲憊時(shí),說(shuō)不定能為人類煮一杯咖啡呢?
評(píng)論列表(已有條評(píng)論)
最新評(píng)論