金融新基建丨AIGC時代遭遇資源瓶頸,金融機構(gòu)如何破局?
2023-08-21 20:54:14 |來源:21世紀經(jīng)濟報道
21世紀經(jīng)濟報道記者李覽青 上海報道
每當談及某項新興技術(shù)在金融場景的落地應用時,CIO們都會告訴記者,投入是其面對的最首要問題。
(資料圖片)
所謂“投入”,并不僅僅是采購系統(tǒng)、服務(wù)的金額,還包括運維成本、人力成本、對已有資源的占用成本、業(yè)務(wù)系統(tǒng)升級改造帶來的隱形成本,以及現(xiàn)有業(yè)務(wù)人員為學習適應新技術(shù)付出的成本等等。
在AIGC時代,提升資源利用效率更是成為金融行業(yè)大模型技術(shù)落地應用的必答題。有行業(yè)專家曾給記者算過一筆賬,如果在金融垂直領(lǐng)域把所有公開數(shù)據(jù)都訓練完,一次達標的預訓練,以彭博旗下BloombergGPT的500億參數(shù)計算,需要花費200張以上的英偉達A100顯卡,僅一次訓練支出在200萬以上,低于這一體量的訓練可能效果會不及預期。
顯然不是所有金融機構(gòu)都有財力和人力來支持這樣大規(guī)模的訓練,但即使是基于廠商已有大模型,金融機構(gòu)在自有環(huán)境下進行精調(diào),依然需要一定的資源支持。此前記者曾報道金融機構(gòu)通過建立AI中臺,將大模型作為所有應用的入口,有采訪對象向記者直言精調(diào)時依然存在算力不夠的問題。
在高昂的投入下,如何優(yōu)化系統(tǒng)架構(gòu),降低業(yè)務(wù)人員使用門檻、提升資源利用率,實現(xiàn)降本增效?
算力瓶頸待解
在支撐大模型技術(shù)落地的“三駕馬車”中,算力是不得不突破的基礎(chǔ)設(shè)施,然而算力緊縮已是全球AI市場必須面對的現(xiàn)實。
與以往的AI訓練模型方式不同,大模型的訓練任務(wù)是“多機多卡”式的,在分布式任務(wù)訓練下需要消耗大量的資源。微軟在近期的財報中首次將GPU的可用性確定為風險因素,微軟表示將繼續(xù)尋找和評估擴大數(shù)據(jù)中心位置和增加服務(wù)器容量的機會,以滿足客戶不斷變化的需求,特別是考慮到對人工智能服務(wù)不斷增長的需求。
通用大模型訓練對算力的要求驚人。據(jù)GPU Utils在今年8月公布的一組數(shù)據(jù)顯示,OpenAI的GPT-4可能需要1萬-2.5萬張英偉達A100顯卡。
而金融機構(gòu)訓練自己的大模型一般以二次訓練精調(diào)(普遍指Fine-tune)為主,在已有預訓練模型的基礎(chǔ)上,在整個神經(jīng)網(wǎng)絡(luò)的最后一層進行修改,其他參數(shù)不變,盡管所需的算力要求相較預訓練小很多,但一次訓練也依然需要數(shù)十張A100顯卡。
“巧婦難為無米之炊,底層算力是客戶要解決的第一個問題?!彬v訊云智能金融行業(yè)負責人汪凱峰告訴記者,特別是算力資源流通不暢的情況下,金融客戶一般有兩種選擇,一是頭部金融機構(gòu)基于過去囤積的GPU進行探索,二是嘗試將少量訓練和精調(diào)挪到公有云上,解決一部分算力問題。
梳理AI資產(chǎn)迫在眉睫
有限的算力迫使金融機構(gòu)降本增效,其中梳理AI資產(chǎn)就成為必經(jīng)之路。
去年12月,財政部提出企業(yè)數(shù)據(jù)資源可作為資產(chǎn)列入財務(wù)報表,數(shù)據(jù)資產(chǎn)化探索進程已加速。在AIGC浪潮下的AI資產(chǎn)不僅包括可用數(shù)據(jù)集,還有AI模型、AI能力等等。
“在大模型出現(xiàn)之前,我們探索AI應用研發(fā)是煙囪式的,很多業(yè)務(wù)部門來找我要卡,一個系統(tǒng)兩張卡,每次都買一堆卡,非常被動,使用效率也不高?!蹦郴鸸究萍疾块T負責人坦言。
在封閉的金融業(yè)務(wù)系統(tǒng)中,破解數(shù)據(jù)孤島已經(jīng)是行業(yè)老生常談的話題,在不同的部門間,數(shù)據(jù)、算法、業(yè)務(wù)系統(tǒng)的隔離都將導致資源的重復利用與浪費。一方面,金融機構(gòu)需要整合歷史遺留的重復AI能力,另一方面,AI資產(chǎn)的管理與治理迫在眉睫。
“金融行業(yè)是數(shù)字化轉(zhuǎn)型走得最快的行業(yè),AI產(chǎn)品形態(tài)五花八門,從算法、業(yè)務(wù)系統(tǒng)到平臺型產(chǎn)品,累積了大量煙囪式的AI資產(chǎn)?!蓖魟P峰提到,在幫助金融客戶進行系統(tǒng)架構(gòu)部署時發(fā)現(xiàn),底層算力使用也較為混亂,對數(shù)據(jù)的可用程度、機器的利用率、業(yè)務(wù)側(cè)調(diào)動算法的次數(shù)等等都沒有充分了解。
對這一問題,汪凱峰表示,騰訊云TI平臺在基礎(chǔ)設(shè)施架構(gòu)方面提供的解法是“上下統(tǒng)一、中間異構(gòu)”,在上層做AI資產(chǎn)門戶展示,在中間層沉淀AI通用能力整合進入中臺。
由于大模型的分布式訓練任務(wù),以“多機多卡”形式推進,更需要對算力資源進行充分的感知與適配。記者了解到,用于大模型訓練的機群下的算力節(jié)點在同一時間分配了不同程度的運行任務(wù),提升AI中臺的感知能力以靈活選擇資源調(diào)度器更為重要。
“金融機構(gòu)需要在厘清AI資產(chǎn)的基礎(chǔ)上,沉淀通用數(shù)據(jù)能力與AI能力,對算法調(diào)用量等信息進行監(jiān)控維護?!蓖魟P峰認為,AI資產(chǎn)梳理不僅僅是中臺的建設(shè),而是從數(shù)據(jù)、算力、算法、應用自下而上的治理。
譬如在助力中國金融期貨交易所的數(shù)字化轉(zhuǎn)型中,中金所技術(shù)公司通過騰訊云TI平臺的能力,每天處理超過2000萬條輿情數(shù)據(jù)、數(shù)億次的調(diào)用次數(shù),平臺成功率超過99%。如果使用傳統(tǒng)的方式處理這些數(shù)據(jù)量,需要構(gòu)建統(tǒng)一的代碼框架,通用的代碼運行環(huán)境,部署維護反向代理工具等工作,將花費大量的人力和時間成本。
另外,模型開發(fā)速度提升方面,TI平臺里面有150多種通用算法和算子能力,用戶可以在工作流中直接訓練模型,并將其放入模型倉庫,形成從模型訓練到發(fā)布再到服務(wù)的閉環(huán),能夠有效降低搭建成本和人力投入。之前需要花費一個月的工作,如今只需要2-3天就能完成。
降低模型開發(fā)門檻
“代碼普惠”成為AIGC時代的另一個關(guān)鍵詞。
據(jù)恒生研究院院長、首席科學家白碩介紹,基于Transformer架構(gòu),大模型目前分為兩條技術(shù)路線,其中GPT的單向預測模型可以理解為“接龍”,而另一條路線類似于“填空”,前者通過一條示意可以容納包括知識、推理、引導、詳細說明,甚至代碼的預測,后者需要兩邊文本的信息指示。
“GPT對AI行業(yè)的沖擊非常大?!卑状T告訴記者,在此之前機構(gòu)部署的AI系統(tǒng)都是“煙囪式”的單個系統(tǒng),“諸多小模型的訓練使堂堂分析師淪為數(shù)據(jù)標注員,而模型的可用性也難以得到保障?!?/p>
事實上,在算力采購、算法優(yōu)化、模型建立的背后,是大量的人力成本消耗。
在各金融機構(gòu)的人員構(gòu)成中,科技研發(fā)人員占比已在逐年增加。在2022年財報中公布相關(guān)數(shù)據(jù)的上市銀行中,工商銀行、農(nóng)業(yè)銀行、建設(shè)銀行、招商銀行科技人員數(shù)量都已破萬,興業(yè)銀行與浦發(fā)銀行兩家銀行科技人員占總員工的比重都超過10%。
對于金融機構(gòu)而言,既期待大模型引領(lǐng)“低代碼”時代的到來降低人力成本,又對大模型訓練需要的人力成本保持謹慎觀望。
獵聘數(shù)據(jù)顯示,今年一季度AI大模型相關(guān)新發(fā)職位同比增長10.16%,算法工程師、機器學習相關(guān)職位的招聘年薪中位數(shù)均達到40萬以上。
“我們曾經(jīng)統(tǒng)計過建模過程中的時間消耗分布,”騰訊云智能-中金所項目技術(shù)負責人梁晨向記者提到,機器學習結(jié)構(gòu)化數(shù)據(jù)的建模過程中,有50%的時間消耗在結(jié)構(gòu)化數(shù)據(jù)的特征提取,即數(shù)據(jù)分析師根據(jù)建模目標對數(shù)據(jù)進行分析,再對特征進行提取,而這樣的數(shù)據(jù)分析師必須熟悉原始數(shù)據(jù)表,對龐大的數(shù)據(jù)體量進行分析,并在金融機構(gòu)跨部門協(xié)調(diào)獲取數(shù)據(jù),在提取特征后再使用這一特征進行建模?!斑@對數(shù)據(jù)分析師的要求非常高,既要熟悉原有的數(shù)據(jù)報表,又要理解業(yè)務(wù)模型構(gòu)建。”梁晨告訴記者,通過平臺沉淀相關(guān)能力后,可以將特征提取人員與建模人員分開,降低模型開發(fā)門檻,提升建模效率。
關(guān)鍵詞:
標簽閱讀
-
金融新基建丨AIGC時代遭遇資源瓶頸,金融機構(gòu)如何破局?
2023-08-21 -
*ST中捷應向呂某支付損失共計53247.68元 律師:根據(jù)一審判決...
2023-08-21 -
美銀:與大眾合作帶來利好 上調(diào)小鵬汽車(XPEV.US)評級至“買入”
2023-08-21 -
A股驚現(xiàn)躺平房企上半年收入77萬,二季度收入不足萬元
2023-08-21 -
寧波中百:上半年凈利1.04億元 同比下降72.0
2023-08-21 -
鴻遠電子上半年凈利潤腰斬,應收賬款高企|看財報
2023-08-21 -
快訊| SOHO中國早盤跌超5% 早前披露上半年業(yè)績下滑;美國運...
2023-08-21 -
【藝周星報】王一博/封神質(zhì)子團鎖新代言!趙露思/劉亦菲/七夕...
2023-08-21 -
貴州醬酒集團亮相“爽爽貴陽·千企千品”發(fā)布會 成為首批“...
2023-08-21 -
服務(wù)業(yè)價格高企 成阻礙英國通脹下降的“最大攔路虎”
2023-08-21 -
新華文軒(00811):提請會議選舉周青為執(zhí)行董事
2023-08-21 -
洞藏放量迎駕貢酒Q2盈利大漲六成 徽酒次高端價格帶競爭升級
2023-08-21 -
天立國際控股(01773)8月21日回購5萬股
2023-08-21 -
豫股半年報丨雙匯發(fā)展“中考”:營收凈利潤“同頻”逆勢上漲...
2023-08-21 -
西南證券給予路斯股份買入評級,目標價位10.1元
2023-08-21 -
珠海冠宇:上半年凈利1.4億元 同比增長125.0
2023-08-21 -
利和興:對外投資設(shè)立控股子公司利和興科技
2023-08-21 -
樂歌股份:上半年凈利潤同比增長239.76%
2023-08-21 -
愛施德:上半年凈利潤3.19億元 同比降21.78%
2023-08-21 -
鐵合金產(chǎn)品迎來首個“綠色”標準 行業(yè)低碳轉(zhuǎn)型還有哪些難點
2023-08-21