直擊WAIC丨對話馬上消費CIO蔣寧:大模型技術在金融行業(yè)落地還存在四個挑戰(zhàn)
21世紀經濟報道記者李覽青 上海報道
在2023年世界人工智能大會上,大模型技術是當之無愧的“話題王”。在通用大模型向前疾馳的同時,大模型技術如何應用于金融等垂直領域,再次成為業(yè)界熱議的問題。
7月6日-8日,在世界人工智能大會舉辦期間,21世紀經濟報道記者專訪了馬上消費金融首席信息官蔣寧,他坦言,如今市場廣泛討論的大模型是生成式模型,而金融行業(yè)真正需要的是多種模型的組合式AI系統(tǒng),如今大模型技術在金融行業(yè)的落地還存在四個方面的挑戰(zhàn)亟待突破,目前為解決金融機構的魯棒性決策問題,依然需要實時人機協作的機制參與。
從“小學生”開始培養(yǎng)
《21世紀》:模型和強化學習并不是新鮮詞,大模型技術和過去相比,在技術層面帶來了怎樣的變革?
蔣寧:強化學習是發(fā)展很久的領域,從AlphaGo到現在OpenAI的ChatGPT,強化學習也在發(fā)生巨大的變化。
強化學習簡單來說是基于人輸入的策略,機器在執(zhí)行過程中不斷地調整這個策略。AlphaGo當年最偉大的突破在于,過去在封閉環(huán)境下機器可以通過強化學習測算博弈獲勝的概率,得到一個概率結果,而AlphaGo可以在兩者博弈的動態(tài)環(huán)境下測算勝率,但它不知道最終的結果。
今天大模型技術的強化學習是一個開放系統(tǒng),每個用戶輸入的內容指令不一樣,機器不知道對方會問什么問題,也不知道該如何更好地回答這個問題。但在開放系統(tǒng)下,在不知道對與錯的情況下,它通過獎勵函數評估出哪個是更好的答案,它不斷通過強化學習實現“越用越聰明”,這就是持續(xù)反饋機制,這是OpenAI的突破。
《21世紀》:國內已經開啟“千模大戰(zhàn)”,今天人工智能大會上也有很多大模型產品發(fā)布,在您看來,您是如何看到國內各家的大模型與Opan AI之間的差異?
蔣寧:我認為目前大模型的核心技術能力,是在于持續(xù)反饋機制。打個比方,企業(yè)推出的大模型相當于博士生畢業(yè),如果沒有高質量的語料數據訓練來讓大模型進行持續(xù)反饋,那這個博士生的知識水平就停留在畢業(yè)時,很快就會被其他擁有自我反饋機制的AI追趕上。而OpenAI的大模型是從“小學生”階段就經歷了全社會全平臺最好的教育,通過巨量數據來進行持續(xù)反饋與強化學習,這樣才能實現“越用越聰明”。
金融領域大模型落地遇四大挑戰(zhàn)
《21世紀》:今年WAIC大模型技術非?;鸨阏J為金融行業(yè)適合大模型技術應用嗎?
蔣寧:大語言模型技術出世后,對金融行業(yè)的人工智能技術應用是“強心劑”,首先金融行業(yè)有三個特點。
第一,第一,金融行業(yè)天然是數據密集型、技術密集型行業(yè),其對數據和技術的使用在各行各業(yè)中都是最廣泛地。第二,金融行業(yè)目前面對的挑戰(zhàn)很多,如銀行線下網點的價值傳遞效率問題、用戶體驗問題,都需要機構持續(xù)創(chuàng)新。第三,金融行業(yè)一直在探索數據資產化,挖掘數據價值,在風險、營銷、運營等方面進行嘗試。
《21世紀》:但是我們看到大模型技術目前在金融行業(yè)落地場景還是很有限,你認為存在哪些挑戰(zhàn)?
蔣寧:我認為挑戰(zhàn)是很多的,主要講四個方面。
第一個挑戰(zhàn)是關鍵性任務和動態(tài)適應性。在動態(tài)系統(tǒng)里,大模型驅動下的人工智能還不具備100%精準決策能力。金融行業(yè)的場景不是一成不變的,面對不可預期的外界環(huán)境和突發(fā)意外情況,大模型并不能做一如既往地給出穩(wěn)定舉措,這給金融機構在人工智能的技術應用提出了一個非常大的挑戰(zhàn)。
第二個挑戰(zhàn)是個性化要求和隱私保護之間的矛盾。金融行業(yè)一直希望通過人工智能來實現極致的用戶體驗,特別是個性化的體驗,但這需要個人隱私數據與大模型技術相融合,這樣帶來的隱私數據保護問題目前還很難有一個解決方案。
第三個挑戰(zhàn)是群體智能與安全可控。大模型的訓練機制決定其需要大量數據來構建增強學習、強化學習的網絡,讓多方共同打造一個平臺,基于這一平臺持續(xù)貢獻數據與反饋,從而讓AI實現技能的進化。但目前出于數據安全考量,行業(yè)內跨組織、跨機構的數據共享機制仍然需要持續(xù)性的探索。
第四個挑戰(zhàn)是對大數據和基礎設施的能力挑戰(zhàn)。未來摩爾時代大模型技術的應用需要高速增長的數據能力,對金融機構網絡、服務器、芯片、底層架構等等都提出了全新的要求,這也是未來需要突破的。
《21世紀》:為應對這些挑戰(zhàn),你認為有哪些技術將被廣泛運用?
蔣寧:我看到三個關鍵技術,概括來說是持續(xù)學習、魯棒性決策以及組合式AI系統(tǒng)。
持續(xù)學習,就像前面所說,它是大模型基于數據的反饋,讓系統(tǒng)越用越聰明。如何構建一個增強的訪客系統(tǒng)讓更多人使用,這就是在線學習、持續(xù)學習、強化學習的技術,這方面我們還有很多需要突破。
魯棒性決策,它是指即使面臨噪聲和突發(fā)情況干擾,大模型也可以作出一致性的可信回答,強調的是可信性。金融業(yè)和工業(yè)領域,0.1%的錯誤都是不被允許的,合規(guī)、安全是最基礎、最核心的要求。無論在怎樣的動態(tài)環(huán)境下,AI都需要排除噪聲干擾,為客戶做出合法合規(guī)的決策,這是魯棒性決策的要求。
組合式AI系統(tǒng),目前大家廣泛討論的AI是生成式大模型,而金融行業(yè)需要判別式大模型,必須直接給出正確或錯誤的結果,二者之間必須有效結合才能發(fā)揮更大價值。從兩類模型的區(qū)別來看,判別式模型的訓練成本很高,每個結果標記對、錯,都是機器不斷學習的過程,但這個結果很難適應變化中的場景,開發(fā)成本很高。生成式大模型的訓練則是需要全員的不斷參與,泛化能力非常強,但它不能生成準確的結果判斷。因此這兩種技術需要相互融合。
金融機構如何試水大模型?
《21世紀》:從這些挑戰(zhàn)來看,是否意味著目前金融行業(yè)的大模型落地還很難?
蔣寧:這要結合大模型從人工智能的布局來看,分為四個大類的象限。第一個象限是基礎領域,包括生成式AI、判別式AI,這是基礎模型領域;第二個象限是在基礎領域上的垂直領域模型,像金融垂直領域的模型;第三個象限是在基礎領域和垂直領域模型的基礎上,創(chuàng)新生產力工具,比如,代碼自動掃描,自動生成語句,這是屬于工具類的;第四類是象限是應用領域,比如,智能客服就屬于應用領域,因為智能客服不可能把大模型、垂直領域模型直接形成智能客服,所以需要第三象限內智能審核工具等應用。
目前金融行業(yè)在第一象限的基礎模型開發(fā)還非常困難,我們缺乏持續(xù)投入信息數據的反饋機制,但在第三第四象限的工具和應用類別上,已經可以實現大模型技術在部分金融業(yè)務場景下的應用了。
《21世紀》:目前馬上消費有嘗試大模型技術的應用嗎?主要在哪些方面?
蔣寧:結合前面我們說的挑戰(zhàn)和技術應用路徑,我們提出了“三橫三豎”戰(zhàn)略。
其中,“三橫”包括:通過持續(xù)學習技術、模型控制、組合式 AI 系統(tǒng)形成的安全、合規(guī)、可信的魯棒性決策能力?!叭Q”包括:一是數據智能,二是多模態(tài)大模型,三是實時人機協作。
目前在應用方面,我們開發(fā)了智能生成報表的工具,在場景方面我們在智能客服上已經有所涉獵。
得益于消費金融公司長期與社會有廣泛交流,在中文高質量數據集相對有限的情況下,我們公司歷史上累加了將近40PB的客戶聲音數據,來幫助我們訓練人機協作模型,訓練人機對話的模型,并且利用大模型技術為人機對話提供更好的幫助。我們基于這樣近千億的數據量和組合模型,結合機器的反饋機制進行強化學習,在不同場景下,把語音、聲紋,包括心理學這些模型融合在一起,同時為了應對機器在突發(fā)情況下的問題,我們通過人機協作的形式實現魯棒性決策,這是我們科技方面的核心競爭能力。