2019中國(guó)金融科技產(chǎn)業(yè)峰會(huì)丨北京融匯金信信息技術(shù)有限公司CEO羅彤:智能助手賦能金融服務(wù)
2019(第二屆)中國(guó)金融科技產(chǎn)業(yè)峰會(huì)于10月31日在北京國(guó)際會(huì)議中心隆重開幕,北京融匯金信信息技術(shù)有限公司CEO羅彤在會(huì)上帶來了主題為《智能助手賦能金融服務(wù)》的演講 。
感謝大家,今天和大家分享一下我們?cè)诮鹑谛袠I(yè)使用的金融服務(wù),我們的名字叫智能助
首先,這方面的需求和這方面的迫切需求是近年來隨著科學(xué)技術(shù)的需求,我們應(yīng)該說是出現(xiàn)的需求 。傳統(tǒng)上,無論是自動(dòng)化還是智能化,主要能力都在工具上 。例如,我們必須做特定的任務(wù) 。我們經(jīng)常做的事情之一是把這個(gè)任務(wù)做成工具,寫的時(shí)候用Word使用WPS,用特定的工具完成特定的任務(wù) 。但是,工具的能力往往是為了解決任務(wù)而解決的,現(xiàn)在隨著產(chǎn)業(yè)的發(fā)展,我們經(jīng)常要做的不是在特定的任務(wù)清單中解決的,而是沒有特定的軟件來完成這個(gè)任務(wù),所以我們現(xiàn)在被稱為知識(shí)的能力,核心是能力
以金融產(chǎn)業(yè)為例,如何提高人在工作中的各種效率,我們主要通過產(chǎn)業(yè)支持提供服務(wù) 。從產(chǎn)業(yè)內(nèi)外來看,我們的金融機(jī)構(gòu)內(nèi)部包括金融機(jī)構(gòu)的對(duì)外客戶,整體問題是代理服務(wù)集團(tuán)非常大,其次產(chǎn)業(yè)知識(shí)來源非常多,金融產(chǎn)業(yè)特別是金融產(chǎn)業(yè)分為互聯(lián)網(wǎng)金融、塊鏈,傳統(tǒng)的醫(yī)藥、制造一個(gè)人很難理解所有的產(chǎn)業(yè)知識(shí)第三,我們需要個(gè)性化服務(wù),給人們帶來這三個(gè)重要問題 。我們?nèi)绾谓鉀Q它?
讓我們先談?wù)勝x予能力的方法,不僅是特定任務(wù)的創(chuàng)造性工作,還能幫助人們做什么 。首先,要獲得知識(shí),也就是說,我們必須有能力大規(guī)模學(xué)習(xí)我們的產(chǎn)業(yè),如金融產(chǎn)業(yè)的相關(guān)知識(shí),并自動(dòng)學(xué)習(xí) 。我們學(xué)習(xí)知識(shí)后,使用知識(shí)服務(wù)人員和服務(wù)世界,我們認(rèn)為兩種自然的交織方式,一種是對(duì)話,二種方式是向用戶展示更豐富的知識(shí),類似于報(bào)告的形式 。
我們說產(chǎn)業(yè)知識(shí)的發(fā)展,在知識(shí)服務(wù)的發(fā)展中分為現(xiàn)階段,回顧歷史,90年代末期,當(dāng)時(shí)的企業(yè)大多倒下,我們知道留在最后谷歌的企業(yè),提供的主要是關(guān)鍵詞知識(shí)服務(wù),近年來逐漸的趨勢(shì)是我們對(duì)很多文本中的關(guān)鍵詞不滿意2007年我自己參加過,當(dāng)時(shí)世界上有很大的熱潮,想用機(jī)器學(xué)習(xí)的方法,現(xiàn)在人工智能的方法可以從文本中獲得很多知識(shí),當(dāng)時(shí)我們有Powerset、Open-Calais和自己的Uptake隊(duì)伍,我們想用知識(shí)服務(wù)客戶,我們想用這個(gè)打敗谷歌 。不幸的是,到了2012年,我們也沒有失敗 。這些企業(yè)被微軟公司、路透社等電子商務(wù)企業(yè)收購(gòu) 。這可能與當(dāng)時(shí)企業(yè)的成熟度有關(guān) 。2012年谷歌提出了知識(shí)地圖的概念,谷歌提出了我應(yīng)該從我所有的文本知識(shí)中建立知識(shí),通過知識(shí)回答用戶的問題,從這里開始,國(guó)內(nèi)近年來聽到了很多知識(shí)地圖的概念,其核心點(diǎn)是我們不滿足很多文本和語(yǔ)言,我們想得到知識(shí),知識(shí)是我們服務(wù)的基礎(chǔ)
第二個(gè)趨勢(shì)是我們不滿足搜索來獲取信息 。2015年谷歌Asistant、微軟Crotana、蘋果Siri希望通過對(duì)話提供服務(wù),我們希望對(duì)話解決一切 。
2016年國(guó)外最有名的金融機(jī)構(gòu)Bloomberg退出的方法是通過現(xiàn)有的金融股票數(shù)據(jù)寫報(bào)告書,2017年開始使用外部市場(chǎng),2018年從谷歌公司挖掘副社長(zhǎng)作為技術(shù)領(lǐng)導(dǎo)者,多次主張Bloomberg的大成果是自動(dòng)化企業(yè)分析報(bào)告書,節(jié)約了很多人力,帶來了很大的價(jià)值 。2018年以后,我們可以通過預(yù)訓(xùn)完成 。這是學(xué)術(shù) 。服務(wù)形式走向?qū)υ挘@是大勢(shì)所趨 。
如何走向知識(shí)服務(wù),具有服務(wù)和學(xué)習(xí)能力的智能助手應(yīng)滿足這三點(diǎn):第一,大規(guī)模學(xué)習(xí)產(chǎn)業(yè)知識(shí),不是簡(jiǎn)單的問答機(jī)器人,而是人們輸入知識(shí)回答用戶的問題,我們的知識(shí)永遠(yuǎn)不會(huì)窮 。迄今為止,很多金融產(chǎn)業(yè)論壇上有很多金融機(jī)構(gòu)的學(xué)生,智力密集型、資金密集型還沒有人用人工手段建立金融體系壟斷的知識(shí)體系 。第二個(gè)問題是,隨著知識(shí)服務(wù)的形式,第一個(gè)是滿足對(duì)話,第二個(gè)是滿足更豐富的報(bào)告,對(duì)話總是一個(gè)接一個(gè)地進(jìn)行,報(bào)告是我對(duì)產(chǎn)業(yè)有知識(shí)的報(bào)告,可以總結(jié)知識(shí)體系,這是下一代智能助手和知識(shí)服務(wù)的重要因素 。
另一項(xiàng)技術(shù)基本本準(zhǔn)備好了 。2008年,我們帶領(lǐng)團(tuán)隊(duì)進(jìn)行旅游領(lǐng)域的語(yǔ)音分析和知識(shí)獲得 。當(dāng)時(shí),美國(guó)的情況是很多愛旅行的高手,想分享很多旅行知識(shí),特意去加利福尼亞討論重要的問題,他很高興 。當(dāng)時(shí)很多行業(yè)的專家都參加了,而且有很多手工特征和傳統(tǒng)的機(jī)械學(xué)習(xí)模型,我們花了一年時(shí)間只做了旅游產(chǎn)業(yè) 。
今天是財(cái)經(jīng)領(lǐng)域,財(cái)經(jīng)是很多產(chǎn)業(yè)領(lǐng)域,現(xiàn)在這個(gè)時(shí)候通過弱監(jiān)管學(xué)習(xí)和深度學(xué)習(xí),我們做產(chǎn)業(yè)圖譜大概需要四個(gè)月的時(shí)間,只有兩個(gè)編輯,這個(gè)圖譜可以擴(kuò)展,但是從建立的速度來說,這是科技給我們帶來了很大的飛躍 。
首先,讓我們看看如何通過機(jī)器閱讀建立知識(shí)體系 。這是一個(gè)示范性的例子 。在這個(gè)例子中,我們可以看到鋰電池 。從這篇文章中,我們可以知道鋰電池的上游是誰,鋰電池可以應(yīng)用于哪個(gè)領(lǐng)域,鋰電池的上下關(guān)系,即鋰電池包括哪個(gè)子類,文本中描述的企業(yè)鋰電池的產(chǎn)業(yè)包括哪個(gè)企業(yè) 。以下是這些公司,公司有哪些客戶群,這是我們公司生產(chǎn)的產(chǎn)品,最后我們不太愿意說這是廣義的知識(shí)圖像,也就是說,我們可以從這里看到知識(shí),其中鋰電池鋰電池的行業(yè)趨勢(shì)是什么樣的,它不僅是一點(diǎn),而且是整體的說明,一點(diǎn)
通過機(jī)器學(xué)習(xí)了這么多知識(shí)后,很大的困難是如何維持它,也就是說,沒有人知道所有的產(chǎn)業(yè),很多專業(yè)機(jī)構(gòu)都很難維持,所以我們使用了方法 。鈦白粉下游產(chǎn)業(yè)不是塑料嗎?這是很多人無法判斷的 。我們做的很多方法是列出來自哪個(gè)文本,一般運(yùn)營(yíng)者看這個(gè)文本,還是判斷你的信息獲得知識(shí)的關(guān)系,我們用這個(gè)方法 。你可以看到行業(yè)細(xì)分為什么有鳳香型,因?yàn)樗鼇碜赃@篇文章 。通過這種方法保證或者我們不適用所有行業(yè)的專業(yè)人員來維護(hù)行業(yè)的知識(shí)體系 。這里所有的東西都來自文本中的自動(dòng)閱讀和提取 。
現(xiàn)在通過建設(shè)的知識(shí)體系復(fù)蓋了130萬人以上的關(guān)系,很多舊數(shù)據(jù)現(xiàn)在有120萬人以上的關(guān)系,細(xì)分的產(chǎn)業(yè)產(chǎn)品有6、7萬人,公司有數(shù)萬人 。
我認(rèn)為可以比較的是現(xiàn)在的行業(yè)狀況,現(xiàn)在的行業(yè)狀況一般是我們國(guó)內(nèi)的行業(yè)知識(shí)圖像大部分是手工制作的,現(xiàn)在的狀況是這樣,或者是垂直的領(lǐng)域,很少?gòu)?fù)蓋整體,我認(rèn)為這是比較好的突破 。
第二個(gè)國(guó)外非百科類圖譜建立,主要是卡耐基梅隆大學(xué)有這樣的體系,有200多萬個(gè)實(shí)例關(guān)系 。百科全書的知識(shí)來自維基百科全書和百度百科全書 。數(shù)據(jù)相對(duì)規(guī)則,易于獲取,但一般行業(yè)知識(shí)相對(duì)稀少 。
當(dāng)你建立了一個(gè)知識(shí)體系,我們把這個(gè)知識(shí)體系加上我們擁有的結(jié)構(gòu)化數(shù)據(jù),我認(rèn)為這構(gòu)成了非常大的知識(shí)服務(wù)能力,通過對(duì)話可以解決用戶的很多問題 。讓我們看看這個(gè)視頻 。
(播放視頻)可以用手機(jī)制作APP,用戶可以繼續(xù)對(duì)話,多次問我指示的問題,或者結(jié)構(gòu)化數(shù)據(jù)中的數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)和知識(shí)相連,可以解決很多問題 。第二,你可以做很多簡(jiǎn)報(bào) 。我們通過你對(duì)知識(shí)體系的定義,人們可以分析產(chǎn)業(yè)所需的要素,連接知識(shí)體系構(gòu)成這樣的報(bào)告 。
我們可以看一下我們做的對(duì)話助手主要是一個(gè)叫知識(shí)型,就是我獲取知識(shí)能夠服務(wù)你,第二任務(wù)型,在我做一些比如說金融產(chǎn)品的特定營(yíng)銷產(chǎn)品或者是某一些特定意義的某種特定提醒的場(chǎng)景,我只是完成一個(gè)任務(wù),而不只是告訴你,你問我的問題是什么,我們能做這兩個(gè)場(chǎng)景,不一定是社交機(jī)器人,比如說微軟小冰就是能夠陪你聊下去 。因此,我們認(rèn)為知識(shí)和任務(wù)是金融助理的關(guān)鍵 。
現(xiàn)在我們的翻譯水平約為97% 。例如,這是對(duì)話機(jī)器人的場(chǎng)景,大家都可以看到,可以隨便問 。(視頻演示)這些知識(shí)來自各種觀點(diǎn)的提取,包括這種關(guān)系來自這篇文本 。這是結(jié)構(gòu)化數(shù)據(jù)的查詢,直接在知識(shí)中進(jìn)行查詢 。當(dāng)然,接到電話也能完成任務(wù) 。
第二,知識(shí)系統(tǒng)包含所有數(shù)據(jù),根據(jù)這些數(shù)據(jù)和我提取的知識(shí),可以自動(dòng)制作機(jī)器學(xué)習(xí)的智能文章,可以制作客觀的數(shù)據(jù)和現(xiàn)實(shí)的報(bào)告,這是白酒行業(yè)的報(bào)告,可以自動(dòng)制作這樣的文字報(bào)告 。
這是抽取報(bào)告,任何產(chǎn)業(yè)都可以一起分析各地的觀點(diǎn),制作這樣的簡(jiǎn)報(bào) 。
與Bloomberg制作的公司的報(bào)告相比,Starbucks根據(jù)其客觀數(shù)據(jù)、行情變化和所在產(chǎn)業(yè),這是自動(dòng)制作的,可以比較的是這個(gè)報(bào)告,當(dāng)然沒有圖表,我們國(guó)內(nèi)很多人都需要圖表
在這方面產(chǎn)業(yè)發(fā)展的最前沿,世界水平一般直接生成數(shù)據(jù)的現(xiàn)在效果并不特別好 。一般來說,我認(rèn)為在產(chǎn)業(yè)上必須提取基于知識(shí)圖像的同時(shí)生成基于信息壓縮的機(jī)器 。此外,報(bào)告有很多工業(yè)化程度,其成熟度需要很多產(chǎn)業(yè)技術(shù),統(tǒng)計(jì)學(xué)習(xí)和人工參與在智能報(bào)告中起著很大的作用,不僅是中國(guó),世界也有可能發(fā)生這種情況 。
金融助手app的效果是,我們?cè)谝恍┙鹑跈C(jī)構(gòu)使用的例子是人工處理服務(wù),原本是3萬個(gè),下降到300個(gè),顧問減少了95%,用戶活躍度提高了5倍,隨著服務(wù)能力的提高,這種形式也很有趣 。
整個(gè)過程是這樣的 。我們實(shí)際上想成為真正知識(shí)的助手、智能助手和知識(shí)的能力,我們的核心是數(shù)字化,需要數(shù)字化、PDF文件和內(nèi)容抽取的過程,需要知識(shí)化的過程,可以應(yīng)用 。有了這些知識(shí),你可以為人們服務(wù),比如問答機(jī)器人、智能報(bào)告,還可以提供電話服務(wù) 。
最后簡(jiǎn)單分享 。我們落地的人工智能產(chǎn)品可能有些企業(yè)想做這件事 。我反復(fù)被各企業(yè)的CEO問了這樣的問題,希望大家分享 。第一,我們應(yīng)用的原則,大部分場(chǎng)景并不是說我們只要一個(gè)低精度,我們往往要求95%以上的精度,90%的精度不好用,意味著一萬篇文章有一千篇是錯(cuò)誤的 。第二大部分問題是小數(shù)據(jù),很少標(biāo)記數(shù)據(jù),必須大量人工解決未標(biāo)記數(shù)據(jù)的問題 。另外,人才的狀況特別重要,很多金融機(jī)構(gòu)落地的人工智能應(yīng)用程序很多,落地緩慢的原因是我們這個(gè)產(chǎn)業(yè)特別需要的是金融業(yè)務(wù),金融場(chǎng)景需要什么,人工智能和機(jī)器學(xué)習(xí)能給我們帶來什么,這樣的人特別少,無論什么機(jī)構(gòu),我自己交往的很多機(jī)構(gòu)都能得到這樣的人,其實(shí)是我們推進(jìn)產(chǎn)業(yè)升級(jí)的重要一點(diǎn),人才最后被制約了
第二個(gè)就是落地關(guān)鍵,反復(fù)要有業(yè)務(wù)場(chǎng)景專家還有人工智能的專家,兩個(gè)人要反復(fù)地聊,定義好確定的場(chǎng)景,光人工智能的人不太懂業(yè)務(wù),想的都是想當(dāng)然,業(yè)務(wù)人員不理解你能干什么 。
另外就是反復(fù)培訓(xùn) 。其馀的是我們常見的問題,各企業(yè)問的問題很多,也就是說工具是否開源,大家是否做的一樣,其實(shí)不然 。如何應(yīng)用知識(shí)解決問題是大工業(yè)應(yīng)用的方法和技能,這還是不同的 。另外,不使用人工智能的技術(shù),核心的判斷點(diǎn)是你做的方法是否規(guī)則,你的精度為什么不高,因?yàn)槿斯ぶ悄艿漠a(chǎn)品不到100%,核心是你的產(chǎn)品中設(shè)置了不到100%的人工智能產(chǎn)品最后為什么預(yù)測(cè)效果只有80%,往往是因?yàn)檫@個(gè)問題很難 。否則,改變團(tuán)隊(duì)提出更高的要求 。
我的共享到此結(jié)束 。非常感謝你 。
【2019中國(guó)金融科技產(chǎn)業(yè)峰會(huì)丨北京融匯金信信息技術(shù)有限公司CEO羅彤:智能助手賦能金融服務(wù)】0
推薦閱讀
- AI時(shí)代,高性能計(jì)算能力作用凸顯
- 2019年財(cái)運(yùn)最好的星座 注定今年大富大貴
- 早教中國(guó)諺語(yǔ)大全:處事篇
- 中國(guó)諺語(yǔ)大全:勤勞節(jié)儉篇
- 湯圓怎么做好吃
- 2019下半年金牛座財(cái)運(yùn)
- 美媒預(yù)測(cè)東京奧運(yùn)女排決賽美國(guó)擊敗中國(guó)奪冠,這是一個(gè)笑話嗎?
- 官方報(bào)價(jià) mb多少錢
- 金融時(shí)報(bào):特朗普的華為禁令可能最終讓美國(guó)“墊底”
- 2019年新年給孩子的祝福語(yǔ) 簡(jiǎn)短一句話新年祝福
