中新網(wǎng)5月25日電 最近,各信息平臺出現(xiàn)的新華社新聞播報引來大家關(guān)注,原因就是一些新聞不是真人播報,而是運(yùn)用AI和3D技術(shù)打造的虛擬數(shù)字人主播播報。直觀來看,單從聲音很難分辨出是真人還是虛擬人物,如果不是標(biāo)題標(biāo)注“AI主播”字樣,大家很難分辨出這是AI的虛擬人物主播在播報新聞。這就是搜狗聯(lián)合新華社推出的3D AI合成主播“新小微”。
搜狗3D AI合成主播采用領(lǐng)先的掃描還原算法,以及面部肌肉驅(qū)動、表情肢體捕捉等超寫實(shí)3D數(shù)字技術(shù),生成高度還原真人發(fā)膚的形象逼真的數(shù)字人物模型,,在搜狗分身AI算法的驅(qū)動下,只需輸入文本內(nèi)容,這個數(shù)字人模型就能根據(jù)語義實(shí)時播報新聞。重要的是,AI虛擬人物主播的表情唇動、肢體動作和語音表達(dá)高度契合,自然逼真度接近真人。
據(jù)了解,搜狗的AI主要沿著兩條線發(fā)展,一個是自然交互,一個是知識計(jì)算。核心是語言AI。通過人和機(jī)器之間進(jìn)行非常自然的交互設(shè)計(jì),從而達(dá)到自然逼真的效果,這其中也使用視覺和聽覺的能力。;在知識計(jì)算上有三部分能力:對話、問答、翻譯。而目前的AI合成主播涉及到搜狗整個AI技術(shù)鏈條上的核心技術(shù)。
搜狗AI交互技術(shù)部總理陳偉近日接受媒體采訪介紹到, 聯(lián)合新華社打造的3D AI合成主播項(xiàng)目研發(fā)周期有半年左右,其中包括數(shù)字人物建模、動作采集。 畢竟現(xiàn)在數(shù)字人本身的技術(shù)不是很成熟,搜狗AI希望能更快速地構(gòu)建一個好的3D建模能力和數(shù)據(jù)能力,更重要的是打通3D技術(shù)和AI技術(shù)。
事實(shí)上虛擬人賽道上不少頭部企業(yè)都有涉獵,對于較早入局的搜狗也有自己的看法,陳偉認(rèn)為,真正的AI有外在的AI也有內(nèi)在的AI。外在的AI就像“搜狗分身”具備逼真或者高逼真的形象。
他還指出,現(xiàn)在的語音助手、電視、音像等用戶的一個助手,按照擬人化的方式來溝通,大部分公司還停留在做一個語言助手或者做一個有對話能力的機(jī)器人。但陳偉認(rèn)為人機(jī)交互應(yīng)該是內(nèi)外兼修的,外在的擬人化和內(nèi)在的擬人化都應(yīng)該具備,從現(xiàn)在來說,搜狗是走在了行業(yè)前端。
對于未來,陳偉表示,接下來搜狗AI主路線是讓一個具備表達(dá)能力的虛擬人物具備交互能力,這是搜狗分身發(fā)展的主路線。未來搜狗將會在整個3D AI合成人物技術(shù)下不斷地打磨,結(jié)合更多的場景做出更自然的表現(xiàn)。例如,不久的將來,AI主播可以到外景去做交互式采訪。
據(jù)悉,搜狗AI主播的商業(yè)化最早落地的是媒體領(lǐng)域和廣電領(lǐng)域,陳偉認(rèn)為媒體領(lǐng)域主播這種類型有一個成熟的流程,即采、編、播、管和存的先后順序,使得它可以從新聞素材的采集到制作到播放,使用AI合成來順利完成一個流程化的工作,解放繁瑣重復(fù)的人工工作。目前搜狗和一些電視臺或媒體的渠道商在合作,把AI主播集成到客戶的系統(tǒng)。
其次,在金融行業(yè),搜狗已經(jīng)做出第一個在金融領(lǐng)域落地的AI面審客服:去年在平安普惠APP上線了第一個AI面審客服,把具有交互式AI客服嵌入到平安普惠服務(wù)中,現(xiàn)在用戶使用平安普惠APP的貸款,可能就是搜狗AI客服在對接。陳偉表示,這項(xiàng)服務(wù)已經(jīng)在平安普惠的客服里面大規(guī)模使用了。基于這樣的能力,未來也會帶動搜狗在金融領(lǐng)域里快速普及。
陳偉坦言,未來3D AI虛擬人物在更多領(lǐng)域具備發(fā)展空間,因?yàn)樗撵`活性和可控性,使得搜狗可以在更多場景下做很多事情,例如,醫(yī)療健康、教育、金融和泛娛樂行業(yè),面向大眾的行業(yè)都可以使用。
曾經(jīng)有人擔(dān)心,AI會減少社會工作崗位,但陳偉不這么認(rèn)為,他指出,AI是要解決密集型勞動和重復(fù)性勞動的職業(yè)痛點(diǎn)。AI真正給社會帶來價值是降本增效,把人力成本降下來,讓工作效率提升,例如目前客服、媒體等行業(yè)。
陳偉還認(rèn)為,AI虛擬人物技術(shù)正在逐漸取代部分人工工作,目的是到最后真正完全替代人工。把人從重復(fù)性工作解放出來,做更有創(chuàng)新性的工作,這是AI技術(shù)未來發(fā)展所思考的。
陳偉表示:“目前AI主播以室內(nèi)播報為主,外景方面也會很快上線,兩會期間搜狗優(yōu)先保證給新華社搭建一套線上完整的虛擬演播廳,在虛擬演播廳下會支持他的站姿、坐姿播報,同時引入了動作、表情、有表現(xiàn)力的一些場景,使得從前到后的制作流程高效化,新聞稿件輸入進(jìn)去立刻生成一個制作精良的3D AI合成主播播送的新聞。”(完)