久草av在线播放_精品综合99久久久久久www_性猛交xxxx乱大交孕妇印度_精品理论片_蜜臀91丨九色丨蝌蚪中文_欧美日韩亚洲综合

Internet Develppment
互聯(lián)網(wǎng)開發(fā)& 推廣服務(wù)提供商

我們擅長(zhǎng)商業(yè)策略與用戶體驗(yàn)的完美結(jié)合。

歡迎瀏覽我們的案例。

首頁 > 新聞中心 > 新聞動(dòng)態(tài) > 正文

微軟推出 ZeRO++ 技術(shù) 可顯著減少大模型訓(xùn)練時(shí)間和成本

發(fā)布時(shí)間:2023-06-27 14:43:14來源:IT之家

  微軟研究人員日前推出了名為 ZeRO++ 的新技術(shù),用于優(yōu)化在訓(xùn)練大型 AI 模型時(shí),容易遇到的數(shù)據(jù)傳輸成本和帶寬限制的難題,可顯著減少大模型訓(xùn)練時(shí)間和成本。

  據(jù)悉,ZeRO++ 建立在現(xiàn)有的 ZeRO 傳輸技術(shù)基礎(chǔ)上,并提供增強(qiáng)的通信策略,可提高訓(xùn)練效率,同時(shí)減少訓(xùn)練時(shí)間和成本。


圖片來自網(wǎng)絡(luò)/侵刪

  為了減少參數(shù)通信量,ZeRO++ 可對(duì)權(quán)重進(jìn)行量化,其利用基于塊的量化方法來保持訓(xùn)練精度,這種優(yōu)化的量化過程相對(duì)原始 Zero 傳輸技術(shù)更快更準(zhǔn)確。為了能夠盡量減少通信開銷,ZeRO++ 通過在每臺(tái)機(jī)器上保持完整的模型副本,以向 GPU 顯存換取通信帶寬。而在梯度通信方面,ZeRO++ 引入了一種名為 qgZ 的新的量化梯度通信方式,可以減少跨節(jié)點(diǎn)的流量和延遲。

  這些改進(jìn)的通信技術(shù)大大減少了通信量,微軟研究人員表示,與 ZeRO 相比,ZeRO++ 減少了高達(dá) 4 倍的通信量,提高了訓(xùn)練吞吐量和效率。當(dāng)在每個(gè) GPU 上使用小批量大小時(shí),在高帶寬集群中,ZeRO++ 相比 ZeRO-3 的吞吐量提高了 28% 至 36%。在低帶寬集群中,與 ZeRO-3 相比,ZeRO++ 實(shí)現(xiàn)了平均 2 倍的加速,使得大模型訓(xùn)練在更多種類的集群上更為可行。

  IT之家注意到,例如 Turing-NLG、ChatGPT 和 GPT-4 這樣的大型模型,其訓(xùn)練需要跨多個(gè) GPU 設(shè)備占用大量顯存和計(jì)算資源,而 ZeRO++ 引入了通信優(yōu)化策略,以克服在低帶寬集群上進(jìn)行訓(xùn)練時(shí)原有 ZeRO 傳輸技術(shù)的帶寬限制。目前微軟已經(jīng)放出了相關(guān)技術(shù)文檔,研究人員可以利用 ZeRO++ 更有效地訓(xùn)練模型,在 AI 領(lǐng)域探索新的可能性。
  (碼上科技

最新資訊
? 2018 河北碼上網(wǎng)絡(luò)科技有限公司 版權(quán)所有 冀ICP備18021892號(hào)-1   
? 2018 河北碼上科技有限公司 版權(quán)所有.
主站蜘蛛池模板: av第一页| 一级在线看 | 日本色综合 | 国产精久久久久久久妇剪断 | 精品国产欧美一区二区三区成人 | 成人一区av | 成人在线亚洲 | 欧美日本国产一区 | 狠狠综合久久av一区二区小说 | 亚洲一区欧美一区 | 久久99精品久久久久久园产越南 | 国产精品美女久久久久久免费 | 久久国产一区 | 色五月激情五月 | 亚洲精品视频在线免费播放 | 你懂的免费在线观看 | 中文字幕亚洲一区二区三区 | 国产精品成人国产乱一区 | 国产成人精品无人区一区 | 欧美猛交ⅹxxx乱大交视频 | 看一级黄色大片 | 亚洲精品久久久久久久久 | 久热精品在线 | 日韩视频一区二区三区 | 国产成人精品一区二区三区视频 | 亚洲一区二区三区中文字幕 | 亚洲免费电影一区 | 永久免费网站 | 国产精品18久久久久久久久 | 极品毛片 | 国产精品99久久久久久www | 久久精品首页 | 国产一区色 | 性视频网 | 国产精国产精品 | 国产精久久一区二区三区 | 日日爽夜夜操 | 日本超碰| 亚洲精品高清视频 | 一区二区三区四区久久 | 日韩在线视频观看 |