招商銀行“低代碼+大模型”創新實踐
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
文 / 招商銀行信息技術部副總經理? 陳曦 招商銀行信息技術部? 楊勉 任軻 王玖華 大模型的迅猛發展,正逐漸成為各行業創新變革的關鍵驅動力。招商銀行敏銳洞察到這一技術趨勢,對大模型與低代碼開發的融合創新進行了深入探索。利用大模型在語義理解、文本生成、知識檢索等方面所展現出的優異特性,我們進一步降低了低代碼開發的門檻、提升了開發者的體驗,有力地推動了招商銀行科技平民化進程。 招商銀行信息技術部 副總經理? 陳曦 招商銀行在低代碼領域的實踐與建設,主要經歷了三個階段。 1.早期探索 招商銀行在早期的諸多業務系統建設中,就已體現了“可視化”“組件化”等設計思想。通過各領域組件的沉淀及復用,有效提升了業務系統的開發效率。此做法可視為招商銀行在低代碼領域的早期實踐。 2.企業級低代碼開發平臺建設 自2019年起,招商銀行啟動了企業級低代碼開發平臺(以下簡稱低代碼平臺)的建設工作。經過5年發展,低代碼平臺已成長為組織級的基礎開發平臺之一,上線應用數過萬。低代碼平臺同時支持零代碼開發與低代碼開發兩種模式,滿足業務與IT用戶不同層次的需求。當前,業務用戶占比達50%以上。 3.低代碼和大模型融合 2023年,招商銀行開始探索低代碼與大模型的融合,利用大模型的新特性為低代碼平臺在開發輔助、應用生成、運營問答、交互體驗等方面帶來顯著提升。 低代碼與大模型融合的思路 在尋找低代碼與大模型的融合點上,我們從以下兩個方向相向而行。 從低代碼開發的全旅程去分析:在需求分析、數據表設計、界面設計、流程編排、測試上線這些環節上,有大量節點可借助大模型降低開發門檻和簡化流程。 從大模型的典型應用模式去分析:智能問答、知識檢索、文本生成、總結摘要等大模型典型應用模式,能夠為開發帶來效率和質量的提升。 當對這兩條路徑進行矩陣式交叉分析后,一系列可供探索的場景便隨之呈現出來。通過對這些場景的價值與優先級進行排序,我們確定了以下重點場景并付諸實踐。 低代碼下的大模型場景實踐 我們依據以上思路,將重點聚焦在“低開Copilot”“低開應用生成”“低開運營”這三大場景之中(如圖1所示)。 圖1? 三大場景實踐 1.低開Copilot (1)前端開發Copilot:JS和CSS生成。低代碼平臺通常提供了默認操作和樣式,若要改動默認操作或樣式,則需要開發者具有一定JS和CSS技能。 在實踐中我們發現,低代碼平臺的一類典型用戶為后端開發者,他們往往對JS語法不熟練,不會使用CSS的情況也很普遍。 因此,在前端頁面的開發中利用Prompt生成JS和CSS代碼,能夠極大簡化定制過程。該功能上線一周便迅速躍居平臺所有功能使用量前三,有效提高了應用開發效率。 (2)后端開發Copilot:數據表創建和業務編排生成。低代碼平臺能生成低代碼應用的核心是DSL。DSL是抽象描述業務功能邏輯和交互規則的一種領域語言。數據表和業務編排都是通過DSL進行描述的。 大模型加入后,后端數據表的創建過程由原來的“界面交互生成DSL”轉變為“通過自然語言描述生成DSL”:即通過自然語言描述其包含的字段,大模型提取出這些字段生成建表的DSL。業務編排也是類似的,通過自然語言描述編排流程,大模型提取到流程的各種節點,生成業務編排的DSL。 上述工作的關鍵在于生成有效的DSL。由于DSL是低代碼的私域知識,不在基礎模型的知識范圍內。而低代碼平臺配套的用戶手冊里僅能描述其規則,而無法窮盡其組合。所以讓大模型生成隨場景變化的DSL具有一定難度。 在解決這個難點上,我們在Prompt中傳入了從私域知識庫中召回的與問題相關度最高的知識樣本,利用Few-shot learning方法讓大模型能夠基于給定的知識樣本生成內容。這在部分場景上可以生成符合標準的DSL。 上述方案也有一定局限性,例如有每次要帶入上下文、Token傳入過長、無法記憶的限制等。下一階段我們計劃通過微調來解決這些問題,進一步提升在DSL生成方面的準確度。 2.低代碼應用生成 當建立了前文所述的一系列“點”上的智能能力,我們再加入工作流將這些單點進行串聯,進而形成“端到端的解決方案”。 低代碼應用開發的一個大類需求來自于“原手工臺賬工作的線上化及系統化”。在這類場景中,大量需手工整理的數據以“Excel表”或“紙質圖表”的形式存在。為了提高這類需求的開發效率,我們推出了端到端的應用生成“Excel生成應用”和“圖片生成應用”(如圖2所示)。 圖2? 智能應用生成 “Excel生成應用”,用戶僅需上傳本地Excel數據表,即可構建出具備全套CRUD功能的應用,并生成表單和表格兩種交互視圖。“圖片生成應用”相較于Excel生成更進一步,能夠先識別紙上的圖片,提取關鍵表格要素,進而生成應用。 端到端生成應用的要解決兩個難點:難點一是能夠有效識別Excel或圖片中的實體,并判斷實體對應字段類型。若僅采用大模型,判斷準確率并不滿足工程要求;我們實踐中把大模型和傳統工程數據字典相結合,準確率提升到95%以上;難點二是要實現實體到數據表、頁面組件及方法的正確綁定。為了提高綁定的準確性,我們建立一系列應用模板,并由模板引擎去選擇合適的模板來生成應用。通過模板固化資源綁定,最終實現應用的準確渲染。 端到端應用構建的功能上線后,開發一個完整應用的時長從小時級壓縮至分鐘級。我們后續還會陸續推出“多輪對話創建應用”“需求文檔創建應用”等端到端解決方案。 3.低代碼運營 低代碼平臺的主知識庫主要由產品文檔和幫助文檔構成。隨著運營的推進,逐漸積累了豐富的問答QA、解決方案、匯報材料等文檔。然而,運營人員常常存在知識盲區,在處理較為復雜的問題時,提供的解決方案有時質量欠佳。 而大模型RAG技術可有效解決上述問題。例如,當用戶向運營同事咨詢應用中的SQL異常應如何解決時,由于運營同事并非SQL方面的專家,所以較難快速準確地定位SQL異常問題的原因。基于RAG的低開運營小助手投產后,其不僅能夠為用戶指出SQL中存在的問題,還可以直接給出優化后的SQL供用戶復制使用。 目前,利用大模型運營的應答準確率已達到75%左右。 低代碼與大模型融合的技術亮點 1.數據飛輪 招商銀行的低代碼平臺歷經幾年發展,當前上線應用數量過萬,涉及的DSL片段超過百萬,沉淀了大量的低開資產。項目組利用規模龐大且具有私域特性的數據,持續對大模型微調,來提升大模型的表現。 為提高私域數據清洗、標注的效率和質量,我們采用“AI自動標注+人工復檢”的方案。利用規則引擎工具,低代碼平臺基于大模型構建了AI自動標注機器人,通過定時任務和跑批的模式對語料進行標注。然后,將這些標注后的語料以任務形式下發給數據標注人員,采用“作業即標注”的方式對自動標注的語料進行校正。校正后的數據用作大模型微調的語料進一步提升模型的表現,實現了數據自動化的閉環。 2.約束大模型的幻覺 在大模型應用過程中生成的DSL片段,少則幾百個字符,多則上萬字符,極易產生“一本正經胡說八道”。如何確保大模型輸出內容的穩定有質量,約束大模型的幻覺,是低代碼平臺所面臨的技術難題。 項目組對DSL片段進行數據分析后發現,同類場景下生成的DSL其主體內容變化有限。例如最為常見的“查詢表單”和“帶CRUD的表格”所對應的DSL片段80%是不變的。基于此,我們對變化部分的DSL進行場景化的分類,構建了其場景化的生成邏輯,限制大模型生成DSL內容變化的范圍。同時生成時采用了反思、思維鏈等模式以提高準確率。通過以上技術改造,顯著降低了大模型產生幻覺的概率,使得生成的DSL片段能夠被平臺所使用。 總結與展望 當前,招商銀行在低代碼與大模型的實踐方面,已取得初步的成果。基于AI能力,如何不斷升級低代碼平臺并助力數字招行的建設,依然任重道遠。未來,我們將進一步拓展大模型在低代碼領域應用的邊界,通過模型的不斷微調構建更精準的DSL,并挖掘更多的端到端場景。同時,在多模態方面深入探索,借助文本、圖像、語音等多種交互方式,打造更為卓越的用戶體驗。 (此文刊發于《金融電子化》2024年9月下半月刊) 該文章在 2024/11/7 10:43:08 編輯過 |
關鍵字查詢
相關文章
正在查詢... |