彩神官方京東工業(yè)大模型Joy industrial發(fā)布,以AI智能體破解工業(yè)供應(yīng)鏈孤島難題
5月22日,京東工業(yè)發(fā)布工業(yè)大模型Joy industrial,成為行業(yè)首個以工業(yè)為核心的工業(yè)大模型。其鎖定工業(yè)場景,依托京東工業(yè)深耕工業(yè)數(shù)智供應(yīng)鏈的產(chǎn)業(yè)積累和數(shù)據(jù)沉淀,構(gòu)建起從底層算力、算法、數(shù)據(jù)到應(yīng)用的全產(chǎn)品矩陣,助力產(chǎn)業(yè)降本、增效、合規(guī)、保供。
Joy industrial此次推出面向京東工業(yè)及供應(yīng)鏈上游供應(yīng)商的需求代理、運營代理、關(guān)務(wù)代理等AI智能體,以及服務(wù)供應(yīng)鏈下游企業(yè)用戶的商品專家及集成專家等AI產(chǎn)品。未來,還會打造汽車后市場、新能源汽車、機器人制造、石油天然氣、電力電網(wǎng)等垂直行業(yè)的工業(yè)大模型。
“京東的大模型正是誕生于產(chǎn)業(yè),成長于產(chǎn)業(yè)。大模型產(chǎn)業(yè)化才能產(chǎn)生價值,只有在落地過程中不斷結(jié)合具體場景的數(shù)據(jù)、業(yè)務(wù)需求不斷打磨,才能使得大模型能力不斷地強化、得到真正的應(yīng)用?!?京東集團探索研究院副院長、京東科技人工智能業(yè)務(wù)部總裁何曉冬表示。
京東作為“以供應(yīng)鏈為基礎(chǔ)的技術(shù)與服務(wù)企業(yè)”,具有廣泛的產(chǎn)業(yè)積累,內(nèi)部產(chǎn)業(yè)場景成為大模型和AI應(yīng)用最好的孵化土壤。
2023年,京東推出自研產(chǎn)業(yè)大模型,就融合了30%數(shù)智供應(yīng)鏈原生數(shù)據(jù)。這些數(shù)據(jù)來自京東超千萬自營商品SKU、數(shù)千萬工業(yè)品SKU、超800萬家活躍企業(yè)客戶的落地實踐,使得大模型天然具備服務(wù)產(chǎn)業(yè)應(yīng)用的能力。此后,京東大模型又迅速納入工業(yè)、健康、物流等專業(yè)領(lǐng)域知識。
至今,在基礎(chǔ)大模型層面,京東已經(jīng)形成涵蓋3B、10B、81B、750B的全尺寸大模型矩陣,能滿足不同業(yè)務(wù)的差異需求。其中,3B和10B可快速響應(yīng);81B主力模型可兼顧性能與時效。京東最新推出的750B超大規(guī)模模型,則利用動態(tài)分層蒸餾、跨領(lǐng)域數(shù)據(jù)治理等京東創(chuàng)新技術(shù)訓(xùn)練,具備“深度思考”和“非深度思考”能力,能同時滿足行業(yè)對“即時響應(yīng)”和“深度推理”的雙重需求。
舉例來說,在客服等需要需要快速響應(yīng)的場景,模型能啟用輕量化推理路徑,實現(xiàn)毫秒級反饋;在供應(yīng)鏈優(yōu)化、醫(yī)療診斷等需要復(fù)雜決策的場景,則啟動深度思考模式,依托1280K的超長上下文窗口,能完成多維度信息的關(guān)聯(lián)與邏輯推演,在長文本1280K“大海撈針”評測中,實現(xiàn)接近100%的準確率。
在大模型應(yīng)用層面,京東內(nèi)部則已經(jīng)生長出超1.4萬個智能體,解決了超過18%的工作內(nèi)容。各類大模型應(yīng)用深入到零售、工業(yè)、物流、健康等業(yè)務(wù)場景。
在所有場景中,工業(yè)又是最適合孵化和使用產(chǎn)業(yè)大模型的場景之一。中國擁有全球最完整的工業(yè)產(chǎn)業(yè)體系,也是全球數(shù)據(jù)資源最豐富的國家,新增數(shù)據(jù)資源占全球的1/4。
京東工業(yè)作為中國領(lǐng)先的工業(yè)供應(yīng)鏈技術(shù)與解決方案服務(wù)商,服務(wù)超萬家重點企業(yè)、260萬中小企業(yè)以及億級消費者。長期以來,京東工業(yè)立足供應(yīng)鏈領(lǐng)域,深耕商品數(shù)智化、采購數(shù)智化、履約數(shù)智化、運營數(shù)智化等工業(yè)場景,積累了豐富的跨行業(yè)供應(yīng)鏈數(shù)據(jù),使京東工業(yè)能夠發(fā)布行業(yè)首個工業(yè)大模型。
京東工業(yè)大模型Joy industrial在訓(xùn)練時,從成本、效率、體驗的三方面考慮出發(fā),為模型更好適配工業(yè)供應(yīng)鏈場景做出優(yōu)化。
在成本方面,工業(yè)大模型Joy industrial基于Scaling Law,選取了工業(yè)應(yīng)用可取得預(yù)期效果的最小規(guī)模大模型,并通過T-S(Teacher-Student)模型訓(xùn)練策略,將大量級模型“瘦身”為小量級模型,既能夠壓降訓(xùn)練、部署和推理成本,也保證Student模型效果與大量級模型接近。
最終工業(yè)大模型的后訓(xùn)練所需資源,僅為通用大模型的1/16,如同把“青龍偃月刀”鍛造成輕便的“手術(shù)刀”,保證了工業(yè)大模型的低成本訓(xùn)練、部署和推理使用。
在效率方面,工業(yè)大模型引入MoE混合專家網(wǎng)絡(luò)架構(gòu),在推理時僅激活少數(shù)適配輸入任務(wù)的專家子網(wǎng)絡(luò),從而降低推理使用成本。同時通過思維鏈CoT自適應(yīng)訓(xùn)練,使得領(lǐng)域大模型可根據(jù)任務(wù)復(fù)雜程度,自動適配思維鏈長度,做到簡單問題不過度思考,提升推理效率。最終訓(xùn)練出的工業(yè)大模型,推理吞吐量相較通用大模型有8倍提升。
在體驗方面,工業(yè)大模型通過領(lǐng)域數(shù)據(jù)合成,匯總并梳理了各種工業(yè)場景,形成與場景匹配的領(lǐng)域任務(wù)層級,隨后通過外部大模型合成高質(zhì)量多任務(wù)學(xué)習(xí)數(shù)據(jù),從而解決了工業(yè)碎片化場景數(shù)據(jù)稀疏的問題。此外,其針對領(lǐng)域任務(wù)層級中的各任務(wù)場景,設(shè)計了可驗證的獎勵函數(shù),通過強化學(xué)習(xí)微調(diào),對開源、通用大模型進行領(lǐng)域后訓(xùn)練,從而降低了對工業(yè)細分場景的數(shù)據(jù)依賴。
最終,工業(yè)大模型適配工業(yè)場景的多個評價指標,相較主流通用大模型都明顯領(lǐng)先,成為更擅長工業(yè)場景應(yīng)用的“業(yè)務(wù)專家”。
憑借這些技術(shù)和路線選擇,工業(yè)大模型Joy industrial能夠工業(yè)領(lǐng)域成本、效率、體驗的最優(yōu)平衡。同時,其擁有京東工業(yè)積累的多模態(tài)數(shù)據(jù),能夠在工業(yè)場景的超長供應(yīng)鏈搭建智能體,完成復(fù)雜協(xié)同調(diào)度,解決工業(yè)供應(yīng)鏈的數(shù)據(jù)孤島、標準割裂、管理復(fù)雜、協(xié)同沖突等難題。
未來,依托于工業(yè)大模型和AI智能體應(yīng)用,其將搭建業(yè)務(wù)協(xié)同“三步走“規(guī)劃:從企業(yè)內(nèi)單一場景、完成單一任務(wù)、提升單點效率的“AI員工”;到企業(yè)內(nèi)大范圍使用AI員工完成“操作執(zhí)行”工作,帶來“AI組織”重構(gòu);最后實現(xiàn)工業(yè)供應(yīng)鏈上下游企業(yè)之間的AI協(xié)同、產(chǎn)業(yè)共同升級,形成“AI產(chǎn)業(yè)生態(tài)”。