我們擅長商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。
歡迎瀏覽我們的案例。
周躍峰在論壇上強(qiáng)調(diào):“AI時(shí)代,模型訓(xùn)練、推理效率與體驗(yàn)的量綱都以Token數(shù)為表征,Token經(jīng)濟(jì)已經(jīng)到來”。為保障流暢的推理體驗(yàn),企業(yè)需持續(xù)加大算力投入,但如何在推理效率與成本之間找到最佳平衡點(diǎn),成為了全行業(yè)亟待解決的重要課題。
為此,華為推出UCM推理記憶數(shù)據(jù)管理器,包括對接不同引擎與算力的推理引擎插件(Connector)、支持多級(jí)KV Cache管理及加速算法的功能庫(Accelerator)、高性能KV Cache存取適配器(Adapter)三大組件,通過推理框架、算力、存儲(chǔ)三層協(xié)同,實(shí)現(xiàn)AI推理“更優(yōu)體驗(yàn)、更低成本”。
在與中國銀聯(lián)的聯(lián)合創(chuàng)新技術(shù)試點(diǎn)中,UCM的技術(shù)價(jià)值得到驗(yàn)證。在中國銀聯(lián)“客戶之聲”業(yè)務(wù)場景下,借助UCM技術(shù)及工程化手段,大模型推理速度提升125倍,僅需10秒即可精準(zhǔn)識(shí)別客戶高頻問題,促進(jìn)服務(wù)質(zhì)量提升。未來,中國銀聯(lián)將依托國家人工智能應(yīng)用中試基地,聯(lián)合華為等生態(tài)伙伴共建“AI+金融”示范應(yīng)用,推動(dòng)技術(shù)成果從“實(shí)驗(yàn)室驗(yàn)證”走向“規(guī)模化應(yīng)用”。
論壇現(xiàn)場,華為正式公布了UCM開源計(jì)劃。UCM通過開放統(tǒng)一的南北向接口,可適配多類型推理引擎框架、算力及存儲(chǔ)系統(tǒng)。今年9月,UCM將正式開源,后續(xù)逐步貢獻(xiàn)給業(yè)界主流推理引擎社區(qū),攜手全產(chǎn)業(yè)共同推動(dòng)AI推理生態(tài)的繁榮發(fā)展。
華為:AI推理創(chuàng)新技術(shù)UCM將于今年9月正式開源 09:24:02
奔馳 CEO 康林松示警:如果沒有油車,歐洲汽車工業(yè)恐將“崩潰” 09:20:05
OpenAI 推出“ChatGPT Go”低價(jià)套餐:僅限特定地區(qū) 09:17:56
無人駕駛物流車迎風(fēng)口,九識(shí)智能發(fā)布新品L5重塑行業(yè)天花板 09:14:33
特斯拉發(fā)布 FSD 演示視頻:舊金山到洛杉磯全程580公里零干預(yù) 09:13:25
前邁凱倫、Alpine老板聯(lián)手前特斯拉高管,打造輕量化電動(dòng)跑車 09:12:17