近日,聯(lián)想百應(yīng)智能體正式宣布引入國產(chǎn)AI大模型DeepSeek 。DeepSeek憑借技術(shù)上的高度創(chuàng)新備受關(guān)注,相比ChatGPT等模型,DeepSeek采用混合專家模型,可將任務(wù)拆分給多個專用子模塊處理,資源利用率更高,大幅降低了大模型訓(xùn)練所需的算力要求。作為國內(nèi)首個面向中小企業(yè)的IT服務(wù)智能體,聯(lián)想百應(yīng)智能體與DeepSeek實現(xiàn)深度融合,能為萬千企業(yè)的智能化轉(zhuǎn)型和發(fā)展提供助力。
聯(lián)想百應(yīng)智能體是基于智能IT引擎“擎天3.0”所打造的一站式服務(wù)平臺。這次與DeepSeek在技術(shù)上實現(xiàn)深度融合,將有效幫助聯(lián)想百應(yīng)智能體豐富技術(shù)“武器庫”,多模態(tài)交互、可視化思維鏈、多方案博弈、多智能體協(xié)作、全鏈路安全五大技術(shù)能力都將得到進一步增強。
在算力調(diào)度方面,DeepSeek 的漸進式分層知識蒸餾技術(shù)獨具優(yōu)勢,它能夠把大型模型蘊含的知識,精準(zhǔn)遷移到更為輕量化的模型之中。這樣一來,在保證模型性能不受影響的前提下,還能顯著降低對計算資源的消耗。當(dāng)這項技術(shù)與擎天 3.0 的混合架構(gòu)調(diào)度能力相結(jié)合,就能最終實現(xiàn) “端 - 邊 - 云 - 網(wǎng) - 智” 的高效協(xié)同運作。這對于企業(yè)而言意義重大,企業(yè)可以在邊緣設(shè)備上輕松部署輕量化模型,減少對云端算力的依賴,從而進一步降低運維成本。
在模型架構(gòu)層面,百應(yīng)服務(wù)大模型的 MoE 架構(gòu)由多個專門的 “專家模型” 構(gòu)成。這些專家模型各自針對特定任務(wù)進行了優(yōu)化,比如 IT 問題診斷、AI 辦公等場景,這種設(shè)計能有效減輕計算負載。而 DeepSeek 同樣具備全球領(lǐng)先的模型架構(gòu),其 DeepSeek R1 模型就采用了 MoE(稀疏混合專家模型)架構(gòu)。引入 DeepSeek 后,能為百應(yīng)服務(wù)大模型 MoE 的動態(tài)調(diào)度提供更有力的支持。具體來說,它可以依據(jù)輸入特征,智能選擇最為匹配的專家模型,進而提升處理效率與輸出質(zhì)量,充分滿足企業(yè)級場景對于資源高利用率的嚴格要求。
和封閉源代碼的國際大模型不同,DeepSeek R1 有著開源、性能卓越、成本低廉這三大突出長處。DeepSeek 依據(jù) MIT 許可協(xié)議,毫無保留地開放其多模態(tài)、多規(guī)格的模型,這種開源舉措極大地推動了相關(guān)技術(shù)在各個領(lǐng)域的擴散。在這樣的技術(shù)生態(tài)環(huán)境里,企業(yè)可以按照自身的實際需求,從眾多選項中挑選出適配的模型與智能體。不僅如此,企業(yè)還能夠依托自身業(yè)務(wù)所積累的數(shù)據(jù),進行定制化的模型訓(xùn)練與推理操作,塑造出更符合自身業(yè)務(wù)特性的專屬崗位智能體。
DeepSeek只是新一輪大模型熱潮的起點,相信聯(lián)想百應(yīng)智能體將持續(xù)深化探索強化學(xué)習(xí)、多模態(tài)融合等前沿技術(shù),進一步提升模型定制化能力。