亞洲資本網(wǎng) > 資訊 > 熱點(diǎn) > 正文
【天天快播報(bào)】年刊節(jié)選|小冰CEO李笛:CG建模數(shù)字人“唯物”,小冰“唯心”
2022-12-26 05:56:58來(lái)源: 娛樂(lè)資本論

在元宇宙熱潮的影響下,2022年,數(shù)字人領(lǐng)域出現(xiàn)井噴。大到互聯(lián)網(wǎng)巨頭,小到創(chuàng)業(yè)公司,紛紛入局?jǐn)?shù)字人領(lǐng)域。

不過(guò),在相對(duì)高調(diào)的數(shù)字人領(lǐng)域,有一家公司,技術(shù)實(shí)力與曝光度遠(yuǎn)未成正比,那就是小冰公司。

相比國(guó)內(nèi)數(shù)字人公司,小冰公司是為數(shù)不多的愿意在“海平面”以下做數(shù)字人基礎(chǔ)設(shè)施的公司。


(相關(guān)資料圖)

小冰公司CEO 李笛

用小冰公司CEO李笛的話說(shuō),小冰想做的AI Beings是有靈魂的數(shù)字人,而不是只能簡(jiǎn)單交互的數(shù)字人外形。

根據(jù)小冰官方數(shù)據(jù),小冰框架是全球?qū)嶋H落地及完備度最高的AI Being基礎(chǔ)框架,覆蓋中國(guó)、日本、印度尼西亞等國(guó)6.6億在線用戶、10億臺(tái)第三方智能設(shè)備和9億內(nèi)容觀眾,商業(yè)客戶覆蓋全球。目前框架內(nèi)運(yùn)行著數(shù)千萬(wàn)AI Beings,其中數(shù)字員工約有30萬(wàn)名。

數(shù)字員工、虛擬陪伴、游戲NPC是小冰數(shù)字人開(kāi)發(fā)的主要場(chǎng)景和應(yīng)用。尤其趁著企業(yè)數(shù)字化轉(zhuǎn)型的浪潮,小冰框架在數(shù)字員工領(lǐng)域大殺四方。

在過(guò)去的一兩年中,在小冰框架的基礎(chǔ)上,不斷為客戶開(kāi)發(fā)出觀君、招小影、崔筱盼、N小黑等一系列專(zhuān)業(yè)領(lǐng)域數(shù)字員工。在李笛看來(lái),數(shù)字員工遠(yuǎn)遠(yuǎn)不止是一張超寫(xiě)實(shí)的面孔,更重要的是可以完美勝任財(cái)務(wù)、教練、客服等一系列工作,且比真人做得更好。

(崔筱盼)

從2014年誕生到現(xiàn)在,小冰已經(jīng)經(jīng)歷了9代。在“海平面”以下,她究竟打下了怎么樣的基礎(chǔ),與市面上的數(shù)字人究竟有什么不同?我們跟小冰公司的CEO李笛聊了聊。

“數(shù)字人行業(yè)在2022年迅速進(jìn)入了一個(gè)紅海市場(chǎng)”

娛樂(lè)資本論:你怎么看我們這次年度大會(huì)的主題——咬定青山?

李笛:人工智能領(lǐng)域需要充足的耐心,沉下心深入研究,也許短期內(nèi)看不出什么,但在未來(lái)回看,卻發(fā)現(xiàn)這些“海平面”以下的事非常重要。就像竹子“咬定青山”地扎下去,把根基打牢,才有可能勃發(fā)。

娛樂(lè)資本論:2022年,數(shù)字人的制作成本快速降低。你如何看待行業(yè)的發(fā)展趨勢(shì)?

李笛:首先明確,數(shù)字人的概念,到底是什么?現(xiàn)在很明確的一件事是,不同的人對(duì)數(shù)字人概念的理解大相徑庭。比如,大家在總結(jié)數(shù)字人技術(shù)的時(shí)候,會(huì)強(qiáng)調(diào)他的建模和動(dòng)捕。這里面隱含的意思就是,他對(duì)數(shù)字人的意思是還是基于外觀的理解。

而當(dāng)我們說(shuō)數(shù)字人的時(shí)候,說(shuō)的是自驅(qū),交互和內(nèi)容生成。

這是一個(gè)比較大的分野。如果只強(qiáng)調(diào)外觀,那么過(guò)去一年的時(shí)間,這個(gè)領(lǐng)域,不是成本在大幅度降低,而是利潤(rùn)在大幅度降低。這個(gè)領(lǐng)域迅速進(jìn)入了一個(gè)紅海的狀態(tài),互相之間殺價(jià)殺到利潤(rùn)非常低。因?yàn)檫@個(gè)領(lǐng)域的技術(shù)同質(zhì)化很?chē)?yán)重。

第二,這些企業(yè)的付費(fèi)客戶一般是各大品牌的市場(chǎng)部門(mén),因?yàn)?,?shù)字人通常被企業(yè)當(dāng)成營(yíng)銷(xiāo)手段的。但小冰旗下的數(shù)字人,是幫助企業(yè)做一些真正的事情的,比如財(cái)務(wù)催款、體育教練、財(cái)經(jīng)新聞撰寫(xiě)等等。

所以,數(shù)字人行業(yè)出現(xiàn)一個(gè)非常奇特的狀態(tài)——如果放在人工智能領(lǐng)域,它有非常大的未來(lái)。但如果它的定義還是一個(gè)外形,那么,他的上限不會(huì)很高,是因?yàn)?,他的市?chǎng)需求量沒(méi)那么大。

娛樂(lè)資本論:很多數(shù)字人的公司都在做“海平面”以上的事情,比如打造一個(gè)更好看的外表,為什么你有勇氣從“海平面”往下做?

李笛:目前市面上很多數(shù)字人的嘗試,我們當(dāng)初在微軟的時(shí)候就都嘗試過(guò)了,比如智能客服系統(tǒng)、智能操作系統(tǒng)、智能音箱等等,我們平行趟了各種坑。所以在做小冰時(shí)候,就已經(jīng)有了一個(gè)完備的技術(shù)框架。

我們對(duì)小冰的一個(gè)基本理念是,完備框架。就是說(shuō),小冰不是一個(gè)基于問(wèn)答,或者不是基于單輪交互,而是基于一個(gè)交互全場(chǎng)的產(chǎn)品,它要求人工智能程序能夠引導(dǎo)這個(gè)交互項(xiàng)目去發(fā)展。為此,她需要有內(nèi)容生成能力,需要有情感,或者說(shuō)情商。

小冰當(dāng)時(shí)其實(shí)是微軟做的第一個(gè)人工智能助理Cortana的Plan B。我們?cè)诋?dāng)年并不是那么明確的知道,哪個(gè)方向才是未來(lái)趨勢(shì)。但是在我們做Cortana的時(shí)候發(fā)現(xiàn),這種基于問(wèn)題,或者是從人工智能那里獲得知識(shí)這種模型,可能并不是唯一的答案,于是我們做了小冰。

經(jīng)過(guò)很多年之后,我們發(fā)現(xiàn)小冰是符合未來(lái)發(fā)展趨勢(shì)的,她的出現(xiàn)更加符合人工智能的發(fā)展上限。

我們認(rèn)為這個(gè)世界上,不會(huì)只有幾個(gè)人工智能助理,或者幾個(gè)回答你問(wèn)題的數(shù)字人,而是有各種各樣的AI Being。

我們要做的事情是,讓這些AI Being跟人的交互,就像人與人一樣。為了這些,我們會(huì)去讓她擁有“情商”,掌握唱歌、畫(huà)畫(huà)等內(nèi)容生成能力。

“我們不做‘替代’人的虛擬人,我們做‘補(bǔ)位’”

娛樂(lè)資本論:為什么你們每次都從數(shù)字員工這個(gè)領(lǐng)域切入?而不是虛擬偶像?

李笛:我們會(huì)判斷什么是AI Being需求最大的地方,從而優(yōu)先篩選具體的賽道。

很遺憾,AI Being需求量最大的地方不是回答問(wèn)題的知識(shí)專(zhuān)家,而主要是三類(lèi)。一類(lèi)是企業(yè)數(shù)字員工,一類(lèi)是人類(lèi)周?chē)呐惆檎?,還有一類(lèi)是游戲里面的NPC。這幾類(lèi)需求很大,所以這些也是我們的主要布局。

娛樂(lè)資本論:聽(tīng)說(shuō)小冰框架在金融資訊領(lǐng)域已經(jīng)有了廣泛地應(yīng)用,是否可以介紹一下?

李笛:比如每日經(jīng)濟(jì)新聞的虛擬人主播N小黑,已經(jīng)穩(wěn)定運(yùn)行了一年多了,365乘以24小時(shí)不間斷播報(bào)財(cái)經(jīng)新聞。他的聲音、肢體、面容,以及播報(bào)的內(nèi)容,都是人工智能小冰框架來(lái)生成、運(yùn)行的。因?yàn)槿绻皇侨潭际侨斯ぶ悄艿脑?,就不能保證24小時(shí)的連續(xù)直播。

像金融摘要,是所有文本里面最難的,因?yàn)樗萌蒎e(cuò)性非常小。比如上市公司的公告100多頁(yè),你要把它壓縮成一個(gè)200多字的資訊。

讓AI Being把幾百頁(yè)的招股書(shū)寫(xiě)成新聞稿這件事不是我們今天才開(kāi)始做的。從5年前開(kāi)始到目前為止,國(guó)內(nèi)90%的機(jī)構(gòu)投資人每天看到的財(cái)經(jīng)資訊,都是小冰生成的。我們專(zhuān)門(mén)為這個(gè)功能搭建了一個(gè)金融知識(shí)圖譜,這個(gè)圖譜里包含1000多個(gè)影響因子。

娛樂(lè)資本論:“觀君”也是小冰框架驅(qū)動(dòng)的數(shù)字人,并且是一個(gè)人工智能的教練,它真的比真人教練更好么?怎么實(shí)現(xiàn)?

李笛:在某些方面,他不光是比真人教練要好,更是真人教練沒(méi)辦法比的。我們有一個(gè)理念,就是我們不做“替代”人的虛擬人,而是要做“補(bǔ)位”,完成真人無(wú)法承擔(dān)的工作。

先拿金融摘要舉例。我們?cè)谕瞥鲞@個(gè)金融摘要之前,絕大多數(shù)上市公司公告是沒(méi)有摘要的。因?yàn)槊刻煸缟嫌?00多個(gè)上市公司發(fā)公告,每個(gè)公告可能都有100多頁(yè),你需要配多少人也來(lái)不及做摘要。但是,作為一個(gè)投資者,我需要知道這些信息,卻不可能看完這么多頁(yè),過(guò)去只能挑著看。所以,我們的方案并不是為了替代人,而是做那些真人他做不到的事情。

同理,體育的訓(xùn)練系統(tǒng)也一樣,AI可以通過(guò)捕捉準(zhǔn)確的運(yùn)動(dòng)軌跡,對(duì)比過(guò)往的數(shù)據(jù),以及其他運(yùn)動(dòng)員的數(shù)據(jù),快速做出分析。這一系統(tǒng)的穩(wěn)定性和準(zhǔn)確性會(huì)遠(yuǎn)遠(yuǎn)高于真人教練。

娛樂(lè)資本論:做出這樣的一個(gè)數(shù)字人,貴么?

李笛:研發(fā)成本不一樣。如果做一個(gè)垂直領(lǐng)域的專(zhuān)業(yè)系統(tǒng),確實(shí)也需要花比較長(zhǎng)的時(shí)間,但它不難。更難的其實(shí)是通用性的開(kāi)放域問(wèn)題,開(kāi)放域的問(wèn)題解決了,再去解決一些垂直領(lǐng)域的問(wèn)題就比較容易。

小冰從2020年開(kāi)始進(jìn)入汽車(chē)的智能座艙領(lǐng)域,到現(xiàn)在兩年時(shí)間,滲透率已超過(guò)60%。所以,從海平面以下開(kāi)始做,你會(huì)越做越順手。

娛樂(lè)資本論:小冰不久前為招商集團(tuán)做了一個(gè)數(shù)字員工叫“招小影”,為什么招商集團(tuán)愿意跟小冰合作?

李笛:有幾方面原因,國(guó)內(nèi)不同的人在提到數(shù)字人的時(shí)候,概念都不一樣,很浮躁。但絕大多數(shù)人提到數(shù)字人的時(shí)候指的都是3D建模,就是創(chuàng)造一個(gè)外形,可以念一段文字,或者有動(dòng)捕的方案做虛擬IP形象。

但我們更關(guān)心,如果是一個(gè)企業(yè)員工的話,他是否能真的能做事情。所以,招小影不光要有外形,她還需要真的出現(xiàn)在招商銀行的ERP系統(tǒng),真的在做招商集團(tuán)員工的工作。同時(shí),她的外觀、語(yǔ)言交互等都不輸于3D建模的同行業(yè)者。

比如,如果你想做一個(gè)數(shù)字人,基于神經(jīng)網(wǎng)絡(luò)渲染這樣的方式,能夠做交互的話,那么,至少讓他的延遲要做到毫秒級(jí)。就是你說(shuō)一句話,數(shù)字人能在毫秒內(nèi)回復(fù)你。但目前行業(yè)的水準(zhǔn)是在分鐘以內(nèi)。

“我們不做系統(tǒng)集成和硬件”

娛樂(lè)資本論:目前小冰主要的收入來(lái)源是哪些?

李笛:我們有幾個(gè)要求。第一,我們不做系統(tǒng)集成,第二,我們不做硬件,只做純軟件的收入。我們目前的收入來(lái)源是B端。

小冰認(rèn)為,未來(lái)人類(lèi)會(huì)被AI Being所環(huán)繞,形成人與虛擬人共處的社交網(wǎng)絡(luò)。這意味著,只要有人的地方,就能有AI Being,它需要是一個(gè)“跨空間”的存在。比如,你的家里、你的車(chē)上、你的社交網(wǎng)絡(luò)平臺(tái)……只有軟件可以實(shí)現(xiàn)。而一旦把AI Being實(shí)體化(硬件化),它就只能存在于那個(gè)實(shí)體中。

娛樂(lè)資本論:B端的收入是什么樣的收費(fèi)模式?

李笛:我們是按照不斷疊加累計(jì)的月服務(wù)費(fèi)和年服務(wù)費(fèi)來(lái)收入。行業(yè)里面主要是按照AI系統(tǒng)的調(diào)用來(lái)收費(fèi),我們不是。

在某些情況下,我們會(huì)按照實(shí)現(xiàn)的效果進(jìn)行分成。我們是按照整個(gè)給你包裝出來(lái)的AI Being賣(mài),你可以理解為我們?cè)凇百I(mǎi)賣(mài)人口”,賣(mài)出去的是一個(gè)服務(wù)包的價(jià)錢(qián)。小冰不賣(mài)技術(shù)。

娛樂(lè)資本論:你說(shuō),小冰要做的就是“販賣(mài)人口”。這個(gè)“人口”的數(shù)量,有上限么?

李笛:數(shù)字員工正在跑的已經(jīng)超過(guò)30萬(wàn)個(gè)了。如果再加上to C的虛擬陪伴,那就是幾千萬(wàn)了。

娛樂(lè)資本論:怎么會(huì)有30萬(wàn)個(gè)這么多?

李笛:在日本大阪試點(diǎn)的老年人家庭,有政府給他們派的數(shù)字員工,每個(gè)家庭里數(shù)字員工都不一樣。因?yàn)槔夏耆丝梢酝ㄟ^(guò)訓(xùn)練,使人工智能變成他想要的“樣子”。數(shù)字員工承擔(dān)的是政府的公共服務(wù)。

娛樂(lè)資本論:我聽(tīng)說(shuō)小冰現(xiàn)在一次對(duì)話能達(dá)到32次?正常人類(lèi)一場(chǎng)對(duì)話平均下來(lái)也只有38次左右。

李笛:目前小冰一次對(duì)話最高可以達(dá)到39次交互。這個(gè)交互技術(shù)和對(duì)話模型,很多公司都在做。但小冰的對(duì)話跟實(shí)驗(yàn)室的研究相比,其實(shí)曾踩過(guò)很多坑。比如,線上的一些交互特別復(fù)雜,2016年的時(shí)候,當(dāng)時(shí)美國(guó)版小冰上線推特剛滿24小時(shí),就被網(wǎng)友的對(duì)話數(shù)據(jù)教成了種族主義者,然后讓CEO出來(lái)道歉。

現(xiàn)在的小冰也是一樣的。你會(huì)看到,實(shí)驗(yàn)室中的數(shù)字人單就對(duì)話質(zhì)量,以及對(duì)話輪次,有很多比小冰更好的,但是大多數(shù)都很難落地。因?yàn)槁涞厣婕暗絻蓚€(gè)問(wèn)題,一個(gè)是成本,一個(gè)是安全性。尤其是對(duì)話安全性方面,一旦出問(wèn)題,很難解決。

所以,歸根到底,安全性一定是小冰公司的第一原則,我們寧愿犧牲一些文本上的豐富性,也不希望小冰框架在安全性上出問(wèn)題。

關(guān)鍵詞: 人工智能 上市公司 系統(tǒng)集成

專(zhuān)題新聞
  • 消費(fèi)稅征稅范圍是什么(詳解消費(fèi)稅的征稅對(duì)象)
  • 農(nóng)行理財(cái)產(chǎn)品會(huì)損失本金嗎?理財(cái)會(huì)不會(huì)把本金虧完?
  • 中國(guó)股市開(kāi)始于哪一年?股市最早出于哪個(gè)國(guó)家?
  • 車(chē)險(xiǎn)險(xiǎn)種怎么選?家用汽車(chē)保險(xiǎn)怎么買(mǎi)劃算?
  • 雖說(shuō)萬(wàn)物皆可盤(pán) 但盤(pán)得住時(shí)光的才是王牌
  • 霍爾果斯:馮小剛等明星資本大撤離
最近更新

京ICP備2021034106號(hào)-51

Copyright © 2011-2020  亞洲資本網(wǎng)   All Rights Reserved. 聯(lián)系網(wǎng)站:55 16 53 8 @qq.com